专利摘要:
インビトロの反応において標的核酸の2つの末端領域を含むDNA構築物を得るための方法の態様が開示される。本方法は、以下の工程を含む:大きな核酸分子を断片化し、標的核酸分子を生成する工程;組換えアダプターエレメントを標的核酸分子の各末端へライゲーションし、アダプター付加標的核酸分子を生成する工程;アダプター付加標的核酸を部位特異的リコンビナーゼへ曝露し、アダプター付加標的核酸から環状核酸産物および直鎖状核酸産物を生成する工程であって、環状核酸産物が標的核酸分子を含む、工程;ならびに、環状核酸産物を断片化し、標的核酸分子の各末端由来の配列領域を含む鋳型核酸分子を生成する工程。
公开号:JP2011510669A
申请号:JP2010545396
申请日:2009-02-04
公开日:2011-04-07
发明作者:ブライアン;クリストファー ゴッドウィン;ゾウタオ チェン;ジアンニ;カロジェロ フェレリ;デビッド;ロデリック リッチズ
申请人:エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft;
IPC主号:C12N15-09
专利说明:

[0001] 発明の分野
本発明は、核酸配列決定、ゲノム配列決定、および連続配列への配列決定結果のアセンブリの分野に関する。]
背景技術

[0002] 発明の背景
ヒトゲノムなどの大きな標的核酸を配列決定する1つのアプローチは、ショットガン配列決定の使用である。ショットガン配列決定において、標的核酸は、一連の重複する核酸フラグメントを生成するために断片化またはサブクローニングされ、これらのフラグメントの配列が決定される。各フラグメントの配列の重複および知見に基づいて、標的核酸の完全な配列が、構築され得る。]
[0003] 配列決定に対するショットガンアプローチの不利な点の1つは、標的核酸配列が多数の小さな反復配列(縦列または逆方向反復配列)を含む場合に、アセンブリが困難であり得ることである。反復領域においてゲノム配列をアセンブリできないと、アセンブリされた配列においてギャップが生じる。従って、核酸配列の最初のアセンブリの後、配列範囲におけるギャップは、埋められる必要があり、アセンブリにおける不確実性は、解消される必要がある。]
[0004] これらのギャップを解消する1つの方法は、配列決定のためにより大きなクローンまたはフラグメントを使用することである。これは、これらのより大きなフラグメントが、反復領域にまたがるのに十分なほど長いためである。しかし、核酸の大きなフラグメントの配列決定は、現行の配列決定装置では、より困難でありかつ時間がかかる。]
[0005] 配列中のギャップにまたがることへの別のアプローチは、大きなフラグメントの両方の末端の配列を決定することである。ショットガン配列決定フラグメントの一方の末端の単一の配列読み取りとは対照的に、両方の末端からの一対の配列読み取りは、既知のスペーシングおよび方向を有する。比較的長いフラグメントの使用はまた、散在する反復エレメントを含む配列のアセンブリに役立つ。このタイプのアプローチ(Smith, M.W. et al., Nature Genetics 7: 40-47 (1994)(非特許文献1))は、ペアエンド配列決定(paired-end sequencing)として当技術分野において公知である。本発明は、ペアエンド配列決定アプローチおよび他の核酸技術に有用な新規の方法、システムおよび組成物を含む。]
先行技術

[0006] Smith, M.W. et al., Nature Genetics 7: 40-47 (1994)]
[0007] 本発明の一態様は、生物のゲノム由来の大きなセグメントであり得る、標的核酸の2つの末端領域を含むDNA構築物をインビトロの反応において得るための方法に向けられる。本方法は、以下の工程を含む。]
[0008] インビトロの反応において標的核酸の2つの末端領域を含むDNA構築物を得るための方法の態様が記載され、これは、以下の工程を含む:大きな核酸分子を断片化し、標的核酸分子を生成する工程;組換えアダプターエレメントを標的核酸分子の各末端へライゲーションし、アダプター付加(adapted)標的核酸分子を生成する工程;アダプター付加標的核酸を部位特異的リコンビナーゼへ曝露し、アダプター付加標的核酸から環状核酸産物および直鎖状核酸産物を生成する工程であって、環状核酸産物が標的核酸分子を含む、工程;ならびに、環状核酸産物を断片化し、標的核酸分子の各末端由来の配列領域を含む鋳型核酸分子を生成する工程。]
[0009] ある実施において、前記方法は、エキソヌクレアーゼを使用して非環状分子を除去する工程をさらに含む。さらに、ある実施において、本方法は、以下の工程をさらに含む:環状核酸産物へ複数の環状キャリアDNA分子を添加する工程;環状核酸産物およびキャリアDNA分子を断片化し、鋳型分子および複数の直鎖状キャリア分子を生成する工程;鋳型分子および直鎖状キャリア分子から断片化の効率を測定する工程;鋳型分子を増幅し、複数の実質的に同一のコピーを含む集団を生成する工程であって、直鎖状キャリア分子が増幅不能である、工程;ならびに、前記集団を配列決定し、鋳型核酸の配列組成を含む配列データを作成する工程。]
[0010] 本発明の方法は、DNAの大きなフラグメント由来の末端を含有するDNA構築物のライブラリーを作製するために、複数の標的DNAフラグメントに対して同時に行われ得る。本発明の1つの利点は、ライブラリーが、原核生物または真核生物宿主細胞を使用することなく、インビトロで構築され得ることである。]
[0011] 従って、本発明は、インビトロの反応において標的核酸の2つの末端領域を含むDNA構築物を得るための方法であって、以下の工程を含む方法に関する:
核酸を断片化し、標的核酸分子を生成する工程;
組換えアダプターエレメントを標的核酸分子の各末端へライゲーションし、アダプター付加標的核酸分子を生成する工程;
アダプター付加標的核酸を部位特異的リコンビナーゼへ曝露し、アダプター付加標的核酸から環状核酸産物および直鎖状核酸産物を生成する工程であって、環状核酸産物が標的核酸分子を含む、工程;ならびに
環状核酸産物を断片化し、標的核酸分子の各末端由来の配列領域を含む鋳型核酸分子を生成する工程。]
[0012] 断片化される核酸は、非常に大きな分子からなってもよい。例えば、前記核酸は、先に実質的にせん断されたかまたはそうでなければ予め断片化された、ゲノムDNAであり得る。この文脈において、新規の本方法は、少なくとも3Kb、少なくとも8Kb、少なくとも10Kb、少なくとも20Kb、少なくとも50Kb、および少なくとも100Kbからなる群より選択される長さを含む標的核酸分子に特に好適である。]
[0013] 本発明の文脈において使用され得る部位特異的リコンビナーゼについての顕著な例は、Creリコンビナーゼである。]
[0014] 環状核酸産物を断片化するための好ましい方法は、噴霧化の工程を含む。好ましくは、環状核酸産物を断片化する工程は、II型制限酵素を使用する環状核酸産物の第1の破壊、および噴霧化を使用する第2の破壊をさらに含み、ここで、II型制限酵素が、環状核酸産物のハイブリッドアダプター領域中の制限部位を切断し、標的核酸由来の短い配列領域を生成し、噴霧化が、標的核酸由来の長い配列領域を生成する。例えば、II型制限酵素はMmeIを含み、短い配列領域は20bp配列長を含む。]
[0015] 第1の態様において、アダプター付加標的核酸を部位特異的リコンビナーゼへ曝露する工程の後、前記方法は、非環状分子を除去する工程をさらに含む。好ましくは、非環状分子は、直鎖状核酸産物およびアダプターダイマー産物を含み、ここで、アダプターダイマー産物は、互いへの2つの組換えアダプターエレメントのライゲーションから作製される。また好ましくは、前記方法は、少なくとも1つのエキソヌクレアーゼを使用して非環状分子を除去する工程をさらに含む。]
[0016] また好ましくは、前記方法は、さらに以下の工程を含む:
−環状核酸産物へ複数の環状キャリアDNA分子を添加する工程;
− 環状核酸産物およびキャリアDNA分子を断片化し、鋳型分子および複数の直鎖状キャリア分子を生成する工程;
− 鋳型分子および直鎖状キャリア分子から断片化の効率を測定する工程;
− 鋳型分子を増幅し、複数の実質的に同一のコピーを含む集団を生成する工程であって、直鎖状キャリア分子が増幅不能である、工程;ならびに、
− 前記集団を配列決定し、鋳型核酸の配列組成を含む配列データを作成する工程。]
[0017] 特に好ましくは、環状キャリア分子は、pUC19を含む。また特に好ましくは、環状キャリア分子は、損傷DNAを含み、ここで、損傷DNAは増幅不能である。その場合、損傷DNAは、UV損傷、アルキル化/メチル化、X線損傷、加水分解、および酸化的損傷からなる群より選択されるタイプの損傷を有し得る。]
[0018] 上記に開示される第1の態様と適合性であり、これと組み合わせられ得る、第2の態様において、本発明の方法は、さらに以下の工程を含む:
−鋳型核酸を増幅し、複数の実質的に同一のコピーを含む集団を生成する工程;および
− 前記集団を配列決定し、鋳型核酸の配列組成を含む配列データを作成する工程。]
[0019] 好ましくは、前記方法は、第2のセットのアダプターエレメントを鋳型核酸分子へライゲーションする工程をさらに含み、ここで、第2のセットのアダプターエレメントが、第1のプライマーエレメントおよび第2のプライマーエレメントを含み、ここで、増幅工程が第1のプライマーエレメントを使用し、配列決定工程が第2のプライマーエレメントを使用する。]
[0020] また好ましくは、鋳型核酸の配列組成は、標的分子の末端由来の配列領域の各々についての配列組成を含む。]
[0021] 上記に開示される第1および第2の態様と適合性であり、これらと組み合わせられ得る、第3の態様において、組換えアダプターエレメントは、第1の組換えアダプターエレメントおよび第2の組換えアダプターエレメントを含み、ここで、第1および第2の組換えアダプターエレメントが両方とも方向エレメントを含む。]
[0022] 好ましくは、環状核酸産物および直鎖状核酸産物は、第1および第2の組換えアダプターエレメント中の方向エレメントが同一の方向関係にある場合に、生成される。その場合、第1および第2の組換えアダプターエレメントは、方向エレメントの同一の方向関係を促進する方向で標的核酸分子へライゲーションする平滑末端を各々が含み得る。]
[0023] また好ましくは、第1および第2の組換えアダプターエレメントは、アダプターコンカテマーの形成を阻害する突出末端を含む。また好ましくは、方向エレメントは、lox配列エレメントを含む。また好ましくは、第1および第2の組換えアダプターエレメントは、方向エレメントの両方の末端にフランキングするパリンドローム配列エレメントを含む。]
[0024] 上記に開示される第1および第2の態様と適合性であり、これらと組み合わせられ得る、第4の態様において、環状核酸産物は第1のハイブリッド組換えアダプターを含み、直鎖状核酸産物は第2のハイブリッド組換えアダプターを含み、ここで、第1および第2のハイブリッド組換えアダプターは、ライゲーションされた組換えアダプター由来のエレメントを含む。]
[0025] 好ましくは、鋳型核酸は、末端配列領域間に配置された第1のハイブリッド組換えアダプターを含む。非常に好ましくは、鋳型核酸は、第1のハイブリッド組換えアダプターと結合された少なくとも1つの濃縮タグを含む。前記濃縮タグは、例えば、ビオチンタグであり得る。]
[0026] さらに、本発明は、インビトロの反応において、標的核酸の2つの末端領域を含む複数のDNA構築物を得るための方法であって、以下の工程を含む方法に関する:
− 大きな核酸分子を断片化し、複数の標的核酸分子を生成する工程;
−組換えアダプターエレメントを標的核酸分子の各末端へライゲーションし、複数のアダプター付加標的核酸分子を生成する工程;
− アダプター付加標的核酸分子を部位特異的リコンビナーゼへ曝露し、アダプター付加標的核酸分子から複数の環状核酸産物および複数の直鎖状核酸産物を生成する工程であって、環状核酸産物が標的核酸分子を含む、工程;ならびに
− 環状核酸産物を断片化し、標的核酸分子の各末端由来の配列領域を含む複数の鋳型核酸分子を生成する工程。]
[0027] さらに、本発明は、上記に開示される方法を行うためのキットであって、
− 複数の組換えアダプターエレメント;および
−部位特異的リコンビナーゼ、
を含むキットを提供する。]
[0028] 部位特異的リコンビナーゼは、好ましくは、Creリコンビナーゼである。]
[0029] 特に、このようなキットは、
− 複数の組換えアダプターエレメント;
−部位特異的リコンビナーゼ、例えば、Creリコンビナーゼ;
−エキソヌクレアーゼ;および
−環状キャリアDNA、例えば、pUC19 DNA
を含み得る。]
[0030] 例として与えられる以下の詳細な説明は、記載される特定の態様に本発明を限定するようには意図されず、参照により本明細書に組み入れられる添付の図面と組み合わせて理解され得る。]
図面の簡単な説明

[0031] (図1)図1A〜1Mは、ペアエンド配列決定ストラテジーの一態様の概略図を示す。数値ラベルは、核酸の起源を示す。「101」は、例えば、図3Aの左側に示される捕捉エレメントの1つのフランキング領域を示す。「102」は、例えば、図3Aの右側に示される、捕捉エレメントの第2のフランキング領域を示す。「103」は、捕捉エレメントを示す。「104」は、断片化された(および任意でサイズ分画された)出発核酸を示す。「105」は、セパレーターエレメントを示す。「106」は、ポリメラーゼを示す。
(図2)ペアエンド配列決定ストラテジーの第2の態様の概略図を示す。
(図3)捕捉フラグメントの配列および設計を示す。配列のアイデンティティーは、以下の通りである:
ペアエンド捕捉フラグメント産物 SEQID NO:1
オリゴ1 SEQ ID NO:2
オリゴ2 SEQ ID NO:3
オリゴ3 SEQ ID NO:4
オリゴ4 SEQ ID NO:5
ペアエンド捕捉フラグメント産物(IIS型、MmeI) SEQ ID NO:6
短いアダプターペアエンド捕捉フラグメント SEQ ID NO:7
短いアダプターペアエンド捕捉フラグメント(IIS型、MmeI) SEQ ID NO:8。
(図4)REフラグメントの一態様を示す。
(図5)REフラグメントの別の態様を示す。
(図6)図6A〜6Fは、ヘアピンアダプターを使用するペアエンド読み取りアプローチを示す。ヘアピンアダプターは、以下の配列を有する:

ヘアピンアダプターは、1つの連続した核酸配列であり、これは、上記の4つの領域へと分割されるように示されている。4つの領域は、左から右へ、ヘアピン領域、制限エンドヌクレアーゼ認識部位、ビオチン化領域、およびIIS型制限エンドヌクレアーゼ認識部位である。「601」は、ヘアピンアダプターを示す。「603」は、ゲノムDNAを示す。Metは、メチル化DNAを示す。「602」は、ヘアピンアダプターダイマーを示す。「604」は、制限エンドヌクレアーゼによって切断されたヘアピンアダプターを示す。「605」は、制限エンドヌクレアーゼによって切断され、再度ライゲーションされた、2つのヘアピンアダプターを示す。SAは、ストレプトアビジンビーズを示す。Bioは、ビオチン(例えば、ビオチン化DNA)を示す。
(図7)ペアエンド手順に対する改善を示す。
(図8)図8A〜8Kは、突出アダプターを用いてのペアエンド読み取りアプローチを示す。
(図9)本発明の産物を配列決定するための1つの方法である「タグ・プライムド」ダブル・エンディッド配列決定を示す。
(図10)アダプター連結された環化を示す。
(図11)ssDNAに基づく環化を示す。
(図12)図12A〜12Iは、ペアエンド配列決定ストラテジー−ペア読み取りPETランダム断片化(Paired-ReadsPET Random Fragmentation)の別の態様の概略図を示す。SPRIは、固相可逆的固定化を指す。
(図13)大腸菌K12を配列決定することからのペア読み取りPETランダム断片化配列決定データを示す。
(図14)図14A〜14Eは、大腸菌エンドヌクレアーゼVによる二本鎖DNA切断の種々の方法を示す。囲まれたヌクレオチド「I」は、デオキシイノシンを示す。図14Aは、二本鎖DNAのヌクレオチド配列が、3’一本鎖パリンドローム突出を生じさせるように大腸菌エンドヌクレアーゼVによる二本鎖切断を指示する方法を示す。3’一本鎖突出がデオキシイノシン残基を含むことに留意すること。図14Bは、二本鎖DNAのヌクレオチド配列が、3'一本鎖非パリンドローム突出を生じさせるように大腸菌エンドヌクレアーゼVによる二本鎖切断を指示する方法を示す。3'一本鎖突出がデオキシイノシン残基を含むことに留意すること。図14Cは、二本鎖DNAのヌクレオチド配列が、5'一本鎖パリンドローム突出を生じさせるように大腸菌エンドヌクレアーゼVによる二本鎖切断を指示する方法を示す。5'一本鎖突出がデオキシイノシン残基を含まないことに留意すること。図14Dは、二本鎖DNAのヌクレオチド配列が、5'一本鎖非パリンドローム突出を生じさせるように大腸菌エンドヌクレアーゼVによる二本鎖切断を指示する方法を示す。5'一本鎖突出がデオキシイノシン残基を含まないことに留意すること。図14Eは、二本鎖DNAのヌクレオチド配列が、平滑末端を生じさせるように大腸菌エンドヌクレアーゼVによる二本鎖切断を指示する方法を示す。
(図15)図15A〜15Iは、逆の鎖にデオキシイノシンを含有するヘアピンアダプター(デオキシイノシンヘアピンアダプター)の大腸菌エンドヌクレアーゼVによる二本鎖切断を用いたペアエンド配列決定ストラテジーの別の態様の概略図を示す。
(図16)図15に示されるデオキシイノシンヘアピンアダプター法を使用する大腸菌K12ゲノムDNAの配列決定から得られたペア読み取り距離の分布を示す。
(図17)本発明のペアエンド配列決定法の別の態様の概略図を示す。ヘアピンアダプター、ペアエンドアダプター(「A」および「B」)ならびにPCRプライマー「F-PCR」および「R-PCR」のヌクレオチド配列は、図18に示される。ペアエンドアダプターの各々は、図18に示されるような二本鎖部分および一本鎖部分を有する。「Bio」は、ビオチンを示す。「Met」は、メチル化塩基を示す。「SA-ビーズ」は、ストレプトアビジンコーティングされた微粒子を示す。「EcoRI」および「MmeI」は、それぞれ、制限エンドヌクレアーゼEcoRIおよびMmeIに対する認識部位を示す。
(図18)図17に示されるアダプターおよびプライマーオリゴヌクレオチドのヌクレオチド配列および修飾を示す。図18Aは、ヘアピンアダプター配列を示す。「iBiodT」は、内部ビオチン標識デオキシチミンを示す。「Bio」は、ビオチンを示す。「EcoRI」および「MmeI」は、それぞれ、制限エンドヌクレアーゼEcoRIおよびMmeIに対する認識部位を示す。図18Bは、ペアエンドアダプター配列およびPCRプライマーヌクレオチド配列を示す。ペアエンドアダプターの各々(「A」および「B」)は、2つの一本鎖オリゴヌクレオチド、「A上部」および「A下部」、「B上部」および「B下部」のアニーリングによって生成される。図18Bに示されるポリヌクレオチド配列の5'末端は、リン酸化されていない。
(図19)油中水型エマルジョンにおけるポリヌクレオチドライゲーションのための方法の一態様の概略図を示す。
(図20)MmeI部位含有キャリアDNAを伴ってかまたは伴わずに得られたペアエンド配列決定データによって達成された大腸菌K12ゲノムDNAの範囲の深さのグラフを示す。
(図21)組換えに基づくペアエンドストラテジーのための方法の一態様の概略図を示す。
(図22)図21の組換えに基づくストラテジーに有用なアダプターの一態様、およびそれから作製されたアダプター産物を示す。SEQ ID NO:57〜64は、出現順に、本明細書に示される。
(図23)アダプター方向性に基づく図21の組換えに基づくストラテジーの産物の概略図を示す。
(図24)図21に示される組換えに基づく方法に少なくとも一部分基づく、大腸菌K12ゲノムDNAの配列決定から得られたペア読み取り距離の分布を示す。
(図25)図21の組換えに基づく方法を使用して生成された長いペアエンドフラグメントから作成された配列情報から提供された利点の概略図を示す。] 図10 図11 図13 図16 図17 図18 図19 図2 図20 図21
[0032] 発明の詳細な説明
他に定義されない限り、本明細書において使用される全ての技術用語および科学用語は、本発明が属する分野の当業者によって一般的に理解されるのと同一の意味を有する。本明細書に記載されるものと類似するかまたは同等である多くの方法および材料が、本発明の実施において使用され得るが、好ましい材料および方法が、本明細書に記載される。]
[0033] 本発明は、核酸の大きなフラグメントの両方の末端を単離および配列決定するための迅速でありかつ費用対効果の高い方法に関する。前記方法は、迅速であり、自動化が適用でき、DNAの大きなフラグメントの配列決定および連結を可能にする。]
[0034] ペアエンド配列決定は、従来の階層的ショットガン配列決定と比較して多数の重要な利点を有し、事実、階層的ショットガン配列決定を補完するものである。これらの利点の間で最も重要なものは、ゲノムに反復エレメントが散在している場合であっても、大きなゲノムの足場を迅速に作る能力である。本発明の方法は、インビトロの反応からDNAフラグメントのライブラリーを生成するために使用され得、ここで、これらのフラグメントは、DNAのより大きなフラグメント由来の末端を含む。なおさらに、本発明の方法は、少なくとも10kbまたはそれより大きい末端間のペア距離スペーシング(paired distance spacing)を使用することによって、最小限の配列決定の試みにより、全体のゲノム足場をアセンブリするために使用され得る。]
[0035] 第1の方法
一態様において、ペアエンド配列決定は、以下の工程において行われ得る。]
[0036] 工程1A
出発材料は、任意の核酸であり得、これらとしては、例えば、ゲノムDNA、cDNA、RNA、PCR産物、エピソームなどが挙げられる。本発明の方法が、核酸出発材料の長いストレッチに対して特に有効である一方で、本発明はまた、小さな核酸、例えば、コスミド、プラスミド、小さなPCR産物、ミトコンドリアDNAなどに適用可能である。]
[0037] DNAは、任意の供給源由来であり得る。例えば、DNAは、そのDNA配列が未知であるかまたは完全には知られていない生物のゲノム由来であり得る。別の例として、DNAは、そのDNA配列が公知である生物のゲノム由来であり得る。公知のゲノムのDNAを配列決定することは、研究者がゲノム多型についてのデータを収集し、遺伝子型を疾患と相関させることを可能にする。]
[0038] 核酸出発材料は、公知のサイズまたは公知の範囲のサイズのものであり得る。例えば、出発材料は、平均の挿入物サイズおよび分布が公知であるcDNAライブラリーまたはゲノムライブラリーであり得る。]
[0039] あるいは、核酸出発材料は、多数の一般的に使用される方法のいずれか1つによって断片化され得(図1A)、これらとしては、噴霧化、音波破砕、HydroShear、超音波断片化、酵素的切断(例えば、リミテッドDNase処理を含むDNase処理、RNase処理(リミテッドRNase処理を含む)、および制限エンドヌクレアーゼによる消化)、予め断片化されたライブラリー(cDNAライブラリーにおけるような)、および化学物質(例えば、NaOH)誘導断片化、熱誘導断片化、およびDNAサンプル全体に切断部位、例えば、制限エンドヌクレアーゼ切断部位を導入し得るトランスポゾン媒介変異が挙げられる。Goryshin I.Y. and Reznikoff W.S., J Biol Chem. 1998 Mar 27;273(13):7367-74;Reznikoff W.S. et al., MethodsMol Biol. 2004;260:83-96;Oscar R. et al., Journal of Bacteriology, April 2001, p.2384-2388, Vol.183, No.7;Pelicic, V. et al., Journal of Bacteriology, October 2000, p.5391-5398, Vol.182を参照のこと。]
[0040] いくつかの断片化法、例えば、噴霧化は、2倍だけサイズが異なる標的DNAフラグメントの集団を生成し得る。他の分画方法、例えば、制限酵素消化は、より広い範囲のサイズをもたらす。さらに他の方法、例えば、HydroShearingは、大きな核酸フラグメントが望まれる場合に好まれ得る。HydroShearing(Genomic Solutions, Ann Arbor,MI, USA)において、溶液中のDNAは、急激な収縮を有するチューブに通される。収縮に近づくにつれ、収縮のより小さな領域を通る体積流量を維持するために、流体が加速される。この加速の間、抗力により、DNAは切れるまで引き伸ばされる。せん断力が化学結合を破壊するには断片が短すぎるようになるまで、DNAは断片化する。流体の流量および収縮のサイズは、最終的なDNAフラグメントサイズを決定する。核酸出発材料を作製するためのさらなる方法は、国際特許出願第WO04/070007号に見出され、これは、参照によりその全体が本明細書に組み入れられる。]
[0041] 使用される断片化法に依存して、DNAの末端は、ポリッシュを必要とし得る。即ち、二本鎖DNA末端は、平滑末端にしてライゲーションに対して適切になるように処理される必要があり得る。この工程は、断片化法に依存して当技術分野で公知の様式において多様である。例えば、機械的にせん断されたDNAは、配列の突出を切断するためにBal31を使用してポリッシュされ得、ポリメラーゼ、例えば、クレノウ、T4ポリメラーゼ、およびdNTPは、充填して平滑末端を生成するために使用され得る。]
[0042] 工程1B
フラグメントのサイズが、所望よりも変化に富む場合、核酸フラグメントは、このサイズバリエーションを減少させるためにサイズ分画され得る。]
[0043] サイズ分画は、当技術分野において公知の多数の方法によって行われ得る任意の工程である。サイズ分画のための方法としては、ゲル法、例えば、パルスゲル電気泳動、およびスクロース勾配または塩化セシウム勾配による沈降、およびサイズ排除クロマトグラフィー(ゲル透過クロマトグラフィー)が挙げられる。選択されるサイズ範囲の選択は、ペアエンド配列決定によってまたぐ領域の長さに基づく。]
[0044] サイズ分画のための1つの好ましい技術は、ゲル電気泳動である(図1Bを参照のこと)。好ましい態様において、サイズ分画されたDNAフラグメントは、互いの25%以内であるサイズ分布を有する。例えば、5Kbサイズの分画は、5Kb+/−1kb(即ち、4Kb〜6Kb)であるフラグメントを含み、50Kbサイズの分画は、50Kb+/−10kb(即ち、40Kb〜60Kb)であるフラグメントを含む。]
[0045] 工程1C
この工程において、「捕捉エレメント」が作製される。捕捉エレメントは、先の工程由来の核酸フラグメントをライゲーションするために使用される一本鎖末端または二本鎖末端を有し得る、直鎖状二本鎖核酸である。「捕捉エレメント」は、順方向および逆方向アダプター末端(円の厚い領域として図1Cに示される)を含む環状核酸(例えば、図1Cに示されるようなプラスミド)として増殖され得る。この環状プラスミドは、捕捉エレメントが使用される前に切断され得る。これらのアダプター末端は、その後の工程において、可能性のあるPCRプライマーおよび配列決定プライマーについてのハイブリダイゼーション部位として役立ち得る核酸配列を含む。]
[0046] 捕捉エレメントは、2つのアダプター末端の間に、さらなるエレメント、例えば、制限エンドヌクレアーゼ認識および/または切断部位、抗生物質耐性マーカー、原核生物または真核生物の複製起点、またはこれらのエレメントの組み合わせを含み得る。このような抗生物質耐性マーカーの例としては、とりわけ、アンピシリン、テトラサイクリン、ネオマイシン、カナマイシン、ストレプトマイシン、ブレオマイシン、ゼオシン(zeocin)、クロラムフェニコールに対する耐性を与える遺伝子が挙げられるが、これらに限定されない。原核生物の複製起点としては、とりわけ、OriCおよびOriVが挙げられ得る。真核生物の複製起点としては、自律複製配列(ARS)が挙げられ得るが、これらの配列に限定されない。さらに、捕捉エレメントは、小さな(PCRによって)増幅可能なフラグメントへその後の核酸産物を消化する(工程L)ために使用され得る制限エンドヌクレアーゼ認識および/または切断部位(例えば、特有かつ稀な部位が好ましい)を含み得る。捕捉エレメントはまた、ペアエンド配列決定のための核酸の容易な精製または濃縮のためのマーカーまたはタグ、例えば、ビオチンを含み得る。]
[0047] 工程1D
捕捉エレメントは、制限エンドヌクレアーゼ消化などの公知の技術を使用して直鎖状化される(平滑末端または粘着末端は、異なるフラグメントの作製のために使用され得る;以下および図1Dを参照のこと)。コンカテマー形成(即ち、互いへの複数の捕捉エレメントのライゲーション)を防止するために、捕捉エレメントは、TAクローニング用のトポイソメラーゼによって脱リン酸化または修飾され得る。]
[0048] 工程1E
捕捉エレメントは、工程Aまたは工程Bのフラグメント(またはサイズ分画されたフラグメント)へライゲーションされ、1つの捕捉エレメントと標的DNAの1つのフラグメントとを含む環状核酸が形成される(図1E)。捕捉エレメントおよび標的DNAは、周知の方法、例えば、DNAリガーゼによるライゲーション、またはトポイソメラーゼクローニングストラテジーによって連結される。]
[0049] 工程1F
先の工程の結果は、大きなサイズのものであり得るDNAフラグメントへライゲーションされた捕捉エレメントのコレクションをもたらす。本工程は、標的DNAフラグメントの大きな内部領域を削除して、自動DNA配列決定に適用できるサイズのクローニングされた挿入物をもたらすために使用される(図1F)。]
[0050] この工程において、捕捉されたゲノムDNA(即ち、工程Eによって生成された環状核酸)は、ゲノムDNA内に1つまたは複数の切断部位を有し得る1つまたは複数の制限エンドヌクレアーゼによって消化される。一般的に、任意の制限エンドヌクレアーゼが、制限エンドヌクレアーゼが捕捉エレメント内を切断しない限り、「内部切断」のために使用され得る。内部切断とは、標的DNAに対して内部であり、捕捉エレメントを切断しない切断をいう。内部切断制限酵素は、選択された制限エンドヌクレアーゼの切断部位を含まないように捕捉エレメントを設計することによって選択され得る。制限エンドヌクレアーゼおよびそれらの使用は、当技術分野において周知であり、本方法に容易に適用され得る。さらに、各々が内部切断に制限される、多数の制限酵素の組み合わせが、標的DNAフラグメントのサイズをさらに減少させるために使用され得る。]
[0051] 好ましい態様において、ゲノムDNAは、1つまたは複数のこれらの制限エンドヌクレアーゼによって、捕捉エレメントの50〜150塩基へと切断される。]
[0052] 工程1G
この工程において、公知の配列の二本鎖核酸である「セパレーターエレメント」が、環状核酸を形成するために、先の工程の消化されたゲノム材料の末端の間にライゲーションされる(図1G)。この「セパレーターエレメント」は、2つの目的を果たす。第1に、セパレーターエレメントは、ミニサークルのローリングサークル増幅のためのプライミング部位を含み得る(以下、工程Iを参照のこと)。第2に、セパレーターエレメントの配列は公知であるので、それは、ペアのゲノム末端の末端にしるしをつける識別子として機能し得る(連結された末端のトリミングおよび容易なソフトフェア分析を可能にする)。即ち、ゲノムフラグメントのその後の配列決定の間、セパレーターエレメントの配列は、ゲノムフラグメント全体が配列決定されたこと示す。このようなセパレーターエレメントはまた、さらなるエレメント、例えば、制限エンドヌクレアーゼ認識および/または切断部位、抗生物質耐性マーカー、原核生物または真核生物の複製起点、またはこれらのエレメントの組み合わせを含み得る。抗生物質耐性マーカーおよび複製起点のようなエレメントの任意の存在にもかかわらず、本発明の方法の利点の1つは、該方法が核酸のクローニング、増幅または他の操作のために宿主細胞(例えば、大腸菌)の使用を必要としないことである。セパレーターエレメントはまた、ビオチン化され得るか、またはそうでなければペアエンド配列決定のために核酸の容易な精製または濃縮のためのマーカーまたはタグでタグ付けされ得る。]
[0053] 工程1H
最後の工程から生成された環状核酸(即ち、ミニサークル)は、一本鎖にされ、一本鎖核酸が得られる。これは、溶液の塩、温度またはpHを変えることによる標準的なDNA変性成技術を使用して行なわれる。他のDNA変性技術は、当業者に公知である。変性の後、同一のミニサークル由来のDNA環は、依然として連結されている場合があるが、これは、本発明の方法に影響を及ぼさない(図1H)。]
[0054] 工程1I
プライマーは、プライマーへアニーリングし得る配列を含むセパレーターエレメントへアニーリングされる。従って、このセパレーター配列は、ローリングサークル増幅のためのイニシエーターとして作用する(図1I)。]
[0055] 工程1J
サンプルはローリングサークル増幅によって増幅され、長い一本鎖産物が作製される(図1J)。このローリングサークル増幅工程の1つの利点は、セパレーターエレメントを含まないエレメントが増幅されず、閉じた環ではないエレメントがほとんど増幅されないことである。]
[0056] 工程1K
1つまたは複数のキャッピングオリゴが、順方向アダプターおよび逆方向アダプター(それらをこれらの領域において二本鎖にする)にフランキングする一本鎖の制限酵素認識部位へアニーリングされる(図1L)。キャッピングオリゴは、捕捉エレメントの少なくとも一部、アダプター領域の少なくとも一部、または両方に相補的であり得る。]
[0057] 工程1L
キャッピングされた一本鎖DNAは、キャッピングされた部位にて小さいフラグメントへと切断される(図1M)。これらの小さなフラグメントは、公知の配列の末端を有し、従来の増幅技術、例えば、PCRを使用して容易に増幅され得る。]
[0058] 第2の方法
第2の態様において、ペアエンド配列決定は、以下の工程において行われ得る。]
[0059] 工程2A−サンプルDNAの断片化
標的核酸の断片化およびサイズ分画は、先の態様についてのものと同一である。]
[0060] 工程2B−メチル化および末端ポリッシュ
所望される場合、断片化された標的核酸は、任意のメチラーゼによってメチル化され得る。好ましいメチラーゼは、制限エンドヌクレアーゼ消化に影響を及ぼすものである。メチラーゼは、少なくとも2つの異なるストラテジーにおいて使用され得る。好ましい一態様において、メチラーゼは、メチル化された制限酵素認識部位でのみ切断する制限エンドヌクレアーゼによる切断を可能にする。別の好ましい態様において、メチラーゼは、非メチル化DNAのみを切断する制限エンドヌクレアーゼによる切断を防止する。]
[0061] 末端ポリッシュの工程は、第1の方法において記載されるものと同一である。]
[0062] 工程2C−タグアダプターのライゲーション
この工程において、アダプターが、標的核酸フラグメントの末端にライゲーションされ(図2、I.)、両方の末端にアダプターを有するフラグメントが生成される。アダプターは任意のサイズのものであり得るが、10〜30塩基のサイズが好ましく、12〜15塩基のサイズがより好ましい。アダプターおよび/または標的核酸フラグメントのコンカテマーの形成を防止するために、アダプターは、平滑末端および不適合性の粘着末端(即ち、5’突出または3’突出を有する末端)を含み得る。アダプターがDNAフラグメントにライゲーションされ、リガーゼが除去された後、粘着末端は、ポリメラーゼおよびdNTPを用いて充填され得る。]
[0063] このセクションのアダプターは、捕捉フラグメントであり得る。捕捉フラグメントの例は、図4および5に示される。]
[0064] コンカテマー形成を防止するために、上記アダプターは、ヘアピンアダプターであり得る(図6A)。ヘアピンアダプターはダイマーよりも大きなマルチマーを形成できないため、ヘアピンアダプターの使用(例えば、図6)はコンカテマーを防止する。コンカテマーを防止するための別の方法は、一方または両方の鎖の5’末端がリン酸化されていないアダプターを使用することである。]
[0065] 使用され得る他のアダプターとしては、リン酸化されていないアダプターが挙げられ、これらは、より少ない処理工程を使用するという利点を有するが、これらはまた、キナーゼを使用するリン酸化工程を必要とする。]
[0066] 本開示中の他の箇所において考察されているように、アダプターは、メチル化されてもよく、またはビオチン化されてもよく、またはその両方であってもよい。]
[0067] 工程2D−エキソヌクレアーゼ消化およびゲル精製
2つのヘアピンアダプターにライゲーションされるDNAフラグメントは、エキソヌクレアーゼを使用して精製され得る。このエキソヌクレアーゼ精製は、両方の末端上でヘアピンアダプターへライゲーションされた二本鎖DNAが、露出した5’末端または3’末端を有さないDNA分子であるという事実を利用する。ライゲーション混合物中の他のDNA、例えば、たった1つのヘアピンアダプターにライゲーションされた二本鎖DNAフラグメント、ライゲーションされていないDNAフラグメント、およびライゲーションされていないアダプターは、エキソヌクレアーゼに感受性である(図6B)。従って、エキソヌクレアーゼへのライゲーション混合物の曝露は、2つのヘアピンアダプターへライゲーションされたDNAフラグメント、およびヘアピンアダプターダイマーを除く、大部分のDNAを除去する。ヘアピンアダプターダイマーは、DNAフラグメントよりも著しく小さいので、それらは、サイズ分画カラム(例えば、スピンカラム)またはアガロースもしくはアクリルアミドゲル電気泳動などの公知の技術、または当技術分野において公知であるおよび/または本開示中の他の箇所において考察されている他のポリヌクレオチドサイズ識別法のうちの1つを使用して除去され得る。]
[0068] 一態様において、アダプターは、タグを保有するフラグメントの単離/濃縮を容易にするために、ビオチン化され得る。]
[0069] 別の態様において、アダプターを含むフラグメントは、タグ配列に相補的な捕捉オリゴヌクレオチドをフラグメントへアニーリングさせることによって精製され得る。]
[0070] 工程2E−環化のためのフラグメントの作製
標的核酸フラグメントの両方の末端へアダプターを付加した後、フラグメントは、環化される。]
[0071] 自己環化のための標的核酸を作製するために、アダプター領域における切断が、多数の理由から望ましい場合がある。例えば、ヘアピンアダプターが使用される場合、遊離5’末端または3’末端が存在しないため、DNAフラグメントは自己環化しない。別の例として、アダプターが、平滑末端をDNAフラグメントに残す場合、切断は、アダプターが5’または3’突出を有することを可能にし、これらの突出(いわゆる「粘着末端」)は、ライゲーション効率を大いに促進する。さらに、アダプター領域における消化は、各末端でライゲーションされた、2つのアダプターを有するDNAフラグメントの選択を可能にする。これは、適合性の粘着末端を制限エンドヌクレアーゼでの切断が残すように、アダプターが設計され得るためである。アダプター領域における切断の後、1つのみのアダプターを有するDNAフラグメント(望ましくない化学種)は、1つの粘着末端および1つの平滑末端を有し、自己環化において困難性を有する。従って、両方の末端にアダプターを有するDNAフラグメントのみが、環化される。]
[0072] アダプターに切断を限定することは、多数の方法によって達成され得る。1つの方法において、アダプターは、メチル化され、非メチル化DNAへライゲーションされる。次いで、前記構築物は、メチル化されたDNAのみを切断する制限エンドヌクレアーゼで消化される。アダプターのみがメチル化されているので、アダプターのみが切断される。]
[0073] 別の方法において、DNAフラグメントはメチル化され得、アダプターはメチル化されない。非メチル化DNAのみを認識および切断する制限エンドヌクレアーゼでの切断は、アダプターに切断を限定する。これは、既にメチル化されている出発DNAを使用することによって、またはインビトロでのメチル化によって達成され得る。]
[0074] ある状況において、アダプターの消化は必要とされないことが、理解される。例えば、先の工程由来のフラグメントが、平滑末端のみを含む場合、アダプターの消化は、任意であり得る。]
[0075] DNAフラグメントがライゲーション/環化を容易にするように処理され得ることがまた、理解される。例えば、アダプターが、ブロックされているか、または5’リン酸を含まない場合、ブロック基が除去され得るか、またはリン酸が付加され得、フラグメントはライゲーションの準備ができている状態にされる。]
[0076] 工程2F環化されたフラグメントを形成するための末端のライゲーション
多数の方法が、環化のために使用され得る。]
[0077] 一態様において、リガーゼが、好適なリガーゼ緩衝液と共に反応混合物に添加され、DNAフラグメントは、再環化することが可能になる。]
[0078] 一態様において、ライゲーションは、自己ライゲーションを促進し、コンカテマーの形成を妨害するために、希薄なDNA濃度にて行なわれる。]
[0079] 別の態様において、ライゲーションは、油中水型エマルジョン中で行われ、ここで、水性液滴は、本開示中の他の箇所において記載されるように、環化されるおよそ1つのフラグメントを含有する。]
[0080] 一態様において、シグナチャータグが、標的核酸フラグメントにライゲーションされ、フラグメントは、自己環化される(図2を参照のこと)。シグナチャータグは、24〜30塩基対の二本鎖核酸配列である。この「シグナチャータグ」は、ペアのゲノム末端の末端にしるしをつける識別子として機能し得る(連結された末端のトリミングおよび容易なソフトフェア分析を可能にする)点で、先の態様の「セパレーターエレメント」と類似している。ゲノムフラグメントのその後の配列決定の間に、シグナチャータグの配列は、標的核酸配列の2つの末端の間の境界を示す。]
[0081] 工程2G
シグナチャータグの付加および自己環化の後、標的核酸フラグメントは、さらに消化または断片化される。断片化は、本開示において列挙される任意の断片化手順を使用して行われ得る。例えば、上記の工程1Aを参照のこと。あるいは、1つまたは複数の制限エンドヌクレアーゼが、標的DNAを消化してフラグメントを生成するために使用され得る。]
[0082] 好ましい一態様において、噴霧器が、平均フラグメントサイズが約200〜300bpになるまで核酸を断片化するために使用される。図2に示されるように、これらのフラグメントのいくつかはシグナチャータグを含み、一方、他のフラグメントはシグナチャータグを含まない。]
[0083] この時点で、核酸フラグメントは、標準的な技術を使用して配列決定され得る。核酸フラグメントを配列決定するための方法は、公知である。配列決定の1つの好ましい方法は、2004年1月28日に出願された国際特許出願第WO 05/003375号に記載される。]
[0084] 工程2H
任意の工程において、シグナチャータグを含むフラグメントは、シグナチャータグを有さないフラグメントから濃縮され得る。濃縮のための1つの方法は、サンプル調製工程においてビオチン化されたシグナチャータグの使用を含む。断片化の後に、シグナチャータグを含むフラグメントは、ビオチン化され、溶液中のストレプトアビジンカラムまたはストレプトアビジンビーズを使用して精製され得る。]
[0085] 濃縮の後、核酸フラグメントは、2004年1月28日に出願された国際特許出願第WO 05/003375号に記載されるものなどの自動化技術を含む標準的な技術を使用して配列決定され得る。]
[0086] 第3の方法
ペアエンド配列決定は、第3の方法によって行なわれ得る。]
[0087] 工程3A〜3E
この方法において、工程A〜工程Eは、第2の方法において記載された通り(即ち、工程2A〜工程2Eの通り)に行われ得る。さらに、第3の方法においては、各アダプターは、制限エンドヌクレアーゼ認識部位から約15〜25bp離れてDNA切断を指示し得るIIS型制限エンドヌクレアーゼ部位を含む。異なるIIS型制限エンドヌクレアーゼがエンドヌクレアーゼ認識部位からの種々の距離にて切断すること、およびこの距離を調節するための異なるIIS型制限エンドヌクレアーゼの使用が企図されることが、公知である。]
[0088] 工程3F環化されたフラグメントを形成するための末端のライゲーション
工程3Fは、シグナチャータグが使用されないことを除いて第2の方法(工程2F)に従って行われ得る(図6Dを参照のこと)。]
[0089] 任意の濃縮工程
本発明の任意の方法において、エキソヌクレアーゼは、環化されていないフラグメントを除去するため、およびコンカテマー化されたフラグメントの存在を減少させるために、ライゲーション後に使用され得る。適切に再環化されたDNAフラグメントは、露出した5’または3’末端を有さないので、それは、エキソヌクレアーゼ消化に対して抵抗性である。さらに、コンカテマーは、より大きく、ニックに起因して露出した5’または3’末端を有する可能性が高い。エキソヌクレアーゼ処理はまた、ニックを有するこれらのコンカテマーを除去する。]
[0090] 任意のローリングサークル増幅
環化されたDNAは、ローリングサークル増幅によって増幅され得る。簡単に記載すると、オリゴヌクレオチドが、再環化されたDNAの一方の鎖へハイブリダイズさせるために使用され得る。]
[0091] このオリゴヌクレオチドプライマーは、ポリメラーゼを用いて伸長される。鋳型は環状であるので、ポリメラーゼは、標的DNAの複数の反復を有する一本鎖コンカテマーを作製する。この一本鎖コンカテマーは、第2のプライマーをそれにハイブリダイズさせ、この第2のプライマーから伸長させることによって二本鎖にされ得る。例えば、この第2のプライマーは、この一本鎖コンカテマーのアダプター配列に相補的であり得る。得られた二本鎖コンカテマーは、次の工程に直接使用され得る。]
[0092] 工程3G DNAの消化/断片化
この工程において、環化された核酸またはローリングサークル増幅からコンカテマー化された核酸は、IIS型制限エンドヌクレアーゼによって消化される(図6D)。工程3Aについて記載されたように、各アダプターは、少なくとも1つのIIS型制限エンドヌクレアーゼ切断部位を含む。IIS型制限エンドヌクレアーゼは、アダプター上のIIS型制限エンドヌクレアーゼ切断部位を認識し、そして約10〜20塩基対離れて核酸を切断する。IIS型制限エンドヌクレアーゼの例としては、MmeI(約20 bp)、EcoP151(25 bp)またはBpmI(14bp)が挙げられる。]
[0093] この工程は、2つの末端の間にアダプター領域を有する、より大きなDNAフラグメントの2つの末端を含むDNAの短いフラグメント(10〜100bp)を生成する(図6E)。同一の構造を生成するための代替の方法は、本開示中の他の箇所において記載される(例えば、工程1Aに記載される)多数のDNA断片化法のいずれかを使用して、環化された核酸をランダムに断片化することである。これは、任意のサイズ(100bp、150bp、200bp、250bp、300bpまたはそれ以上)のフラグメントが作製されることを可能にする。]
[0094] いずれかの方法によって、その中間にアダプター領域を有さない他のDNAフラグメントもまた、生成される(図6E)。しかし、アダプター領域はビオチン化されているので、アダプター領域を含むDNAは、例えば、ストレプトアビジンビーズ、アビジンビーズ、BCCPビーズなどのビオチンに対して親和性を有する固体支持体を使用して、選択的に精製され得る。]
[0095] 工程3H.配列決定
本発明の任意の方法の産物は、手動か、または自動化された配列決定技術によって配列決定され得る。サンガー配列決定またはマクサム−ギルバート配列決定のような方法による手動の配列決定が、周知である。自動化された配列決定は、例えば、454 Life Sciences Corporation(Branford, CT)によって開発された454 Sequencing(商標)のような自動化された配列決定法を使用することによって行なわれ得、これはまた、出願WO/05003375(2004年1月28日に出願)ならびに同時係属中の米国特許出願USSN:10/767,779(2004年1月28日に出願)、USSN:60/476,602(2003年6月6日に出願);USSN:60/476,504(2003年6月6日に出願);USSN:60/443,471(2003年1月29日に出願);USSN:60/476,313(2003年6月6日に出願);USSN:60/476,592(2003年6月6日に出願);USSN:60/465,071(2003年4月23日に出願);およびUSSN:60/497,985(2003年8月25日に出願)に記載されている。]
[0096] 簡単に記載すると、自動化された配列決定手順、例えば、454 Life Sciences Corp.によって開発された配列決定手順において、1つの配列決定アダプター(配列決定アダプターA)が、DNAフラグメントの1つの末端にライゲーションされ得、第2の配列決定アダプター(配列決定アダプターB)が、DNAフラグメントの第2の末端にライゲーションされ得る。ライゲーションの後、DNAフラグメントは、ビオチンを固体支持体に結合することによって、ライゲーションされていない配列決定アダプターから精製され得る。単離された核酸フラグメントは、個々の反応チャンバー中に配置され得、配列決定アダプターAおよび配列決定アダプターBに対して特異的なプライマーを使用してのPCRによってさらに増幅され得る。AアダプターまたはBアダプターのいずれかにビオチンを結合させることによって、優先的にA−Bフラグメントからなる一本鎖DNAが、単離され得る。この増幅された核酸は、配列決定アダプターA、配列決定アダプターBに特異的な配列決定プライマー、または、2つの末端の間に置かれたアダプター(例えば、ヘアピンアダプター)に特異的な配列決定プライマーを使用して配列決定され得る。]
[0097] より大きなDNAフラグメントの末端を含む複数のこれらのフラグメントが一旦作製されると、それらは配列決定され得、ペアエンド配列情報が、ゲノムの部分的または完全な配列地図を作成するためにアセンブリされ得る。]
[0098] 第4の方法
ペアエンド配列決定は、図12に概説されるようなペア読み取りPETランダム断片化と呼ばれる上述の方法のバリエーションを使用して行なわれ得る。この第4の方法に従う実験からの結果を、図13に示す。]
[0099] 工程4A〜4E
この方法において、工程A〜工程Dは、第2の方法または第3の方法(即ち、工程2A〜工程2Dまたは工程3A〜工程3D)において記載される通りに行われ得る。代替法として、工程4Dは、エキソヌクレアーゼ処理フラグメントを精製するために、SPRI(固相可逆的固定化)を使用して行なわれ得る。例えば、図12中の核酸フラグメントは、ビオチン化プライマーへライゲーションされ、例えば、ストレプトアビジン、アビジン、親和性の減少したストレプトアビジンまたは親和性の減少したアビジンでコーティングされたビーズを使用して精製され得る。]
[0100] 工程4Eは、工程2Eまたは工程3Eに記載される通りに行われ得る。]
[0101] 工程4Fは、工程3Fに記載される通りに行われ得る。簡単に記載すると、最後の工程において作製された直鎖状DNAフラグメントは、工程2Fまたは工程3Fについて上述されたような環化の任意の公知の方法を使用して環化され得る。]
[0102] さらに、上記の工程3Fに記載されるような任意の濃縮工程が、環状核酸を濃縮するために行われ得る。簡単に記載すると、環化されていない核酸は、遊離末端を有する核酸を分解するエキソヌクレアーゼによって除去され得る。共有結合で閉じられた環状核酸は、遊離末端を有さず、そしてエキソヌクレアーゼ攻撃に対して耐性である。これに起因して、エキソヌクレアーゼでの処理は、直鎖状核酸を除去しつつ環状核酸を濃縮する。]
[0103] 工程4G
自己環化の後、断片化が、本開示に列挙される任意の断片化手順を使用して行なわれ得る。1つの好ましい方法は、機械的せん断を使用して、環状核酸を断片化することである。機械的せん断は、例えば、ボルテックスすることによって、小さい開口部へ溶液中の核酸を押し通すことによって、または本開示中の他の箇所において記載される他の類似の手順によって行なわれ得る。機械的せん断の1つの利点は、異なる長さの核酸が作製され得ることである(図12における工程Gの後の核酸を参照のこと)。]
[0104] 中間にアダプター領域を有さないDNAフラグメントもまた、生成される。図12を参照のこと。しかし、アダプター領域はビオチン化されているので、アダプター領域を含むDNAは、例えば、ストレプトアビジンビーズ、アビジンビーズ、BCCPビーズなどのようなビオチンに対して親和性を有する固体または半固体支持体を使用して、選択的に精製され得る。]
[0105] 工程4H
方法4の産物は、利用可能な任意の手動または自動の方法を使用して配列決定され得る。このような方法は、上記の工程3Hにおいて詳細に記載される。]
[0106] 上述され、図12に概説されるような、ペア読み取りPETランダム断片化は、多数の利点を提供する。第1に、機械的せん断はより長いフラグメントを生じ得、これは、次に、より長い読み取りを可能にするため、方法4は、アセンブリにおけるより高い信頼性を可能にする。より長い読み取りは、より高い信頼性を伴う標的配列のアセンブリを可能にする。第2に、機械的せん断によって可能にされたより長いフラグメントは、核酸のより長い領域にまたがるペアエンド読み取りを生じる。核酸のより長い領域にまたがることによって、方法4は、ギャップ閉鎖を容易にし、そしてまた、分析が困難である核酸の領域にまたがる可能性が高い。これらの困難な領域は、例えば、反復領域または高いGC含量の領域であり得る。この様式において、方法4は、改善されたギャップ閉鎖性能の利点を提供する。第3に、方法4は、ギャップ閉鎖を提供するその能力に起因して、各個々の末端がアセンブリを構築するために使用され得るので、完全なゲノムを配列決定するために専ら使用され得る。]
[0107] 方法4の利点の例は、図13において見られる。図13は、方法4を使用して配列決定された大腸菌K12ゲノムDNAを示す。見られるように、50未満〜約400の、有意に長い読み取り長さの分布が、この方法を使用して可能である。さらに、約3kbのフラグメント長が生成され得、それらの末端が配列決定され得る。これは、方法4が他の方法と比較して優れたギャップ閉鎖性能を提供することを示す。]
[0108] 第5の方法
ペアエンド配列決定は、図15において概説されるような上述の方法のバリエーションを使用して行なわれ得る。]
[0109] この方法において、アダプターは、ヘアピンの二本鎖領域の逆鎖上にデオキシイノシンヌクレオチド(本明細書中でイノシンとも呼ばれる)を組み込むデオキシイノシンヘアピンアダプターとして設計され得る。大腸菌エンドヌクレアーゼV(EndoV)は、イノシンヌクレオチドから2番目のヌクレオチド3’と3番目のヌクレオチド3’との間に一本鎖切断(ニック)を導入する(Yao M and Kow YW, J Biol Chem. 1995, 270(48):28609-16;Yao M and Kow YW, J Biol Chem. 1994, 269(50):31390-6;Yao M et al., Ann N Y Acad Sci. 1994, 726:315-6;Yao M et al., J Biol Chem. 1994, 269(23):16260-8)。]
[0110] 図14に示されるように、ヘアピンアダプター中のイノシンの相対的な配置は、両方の鎖のEndoV切断の際に、3’一本鎖突出(図14Aおよび図14B)、5’一本鎖突出(図14Cおよび図14D)、または平滑末端(突出なし)(図14E)が作製されるかどうかを決定する。ヘアピンアダプターの配列はまた、EndoV切断の際に非パリンドローム(図14AおよびB)またはパリンドローム(図14AおよびC)の一本鎖突出を生成するように設計され得る。デオキシイノシンが4つの塩基、A、G、CおよびTのいずれかと、およびそれ自体と対形成することは、当技術分野において周知である(Watkins and SantaLucia, 2005, Nucleic AcidsRes. 33(19):6258-67)。さらに、アダプターは、本開示中の他の箇所において開示されるように、IIS型制限エンドヌクレアーゼ認識部位(例えば、MmeI)を含み得る。]
[0111] 工程5A(図15工程A)
この方法において、工程Aは、工程1Aについて記載されたように、実質的に行なわれ得る。標的DNAは、上述したように、当技術分野において公知である任意の物理的または生化学的方法によって断片化され得る。任意で、得られたフラグメントは、本開示中の他の箇所において記載される任意のサイズ分画法によってサイズ分画され得る。]
[0112] 工程5Bおよび5C(図15工程B+C)
標的DNAの末端が、本明細書に記載される任意のポリッシュ法によってポリッシュされ得、上述のデオキシイノシンヘアピンアダプターへライゲーションされ、アダプターでタグ化された標的DNAが形成され得る。]
[0113] 工程5D(図15工程D)
ライゲーション反応は、1つまたは複数のエキソヌクレアーゼによって処理され得(本明細書中の他の箇所において考察されている通り)、本明細書に記載される任意の方法によってサイズ分画され、所望の反応産物が濃縮され得る。]
[0114] 工程5E(図15工程E)
アダプターでタグ化された標的核酸は、EndoVによって切断される。切断反応についての条件は、Yaoらによって記載される条件のいずれか(Yao M and Kow YW, J Biol Chem. 1995, 270(48):28609-16;Yao M and Kow YW, J Biol Chem. 1994, 269(50):31390-6;Yao M et al., Ann N Y Acad Sci. 1994, 726:315-6;およびYao M et al., J Biol Chem. 1994, 269(23):16260-8)であり得る。当業者は、同様の条件も使用され得ることを認識する。]
[0115] 工程5F〜H(図15工程F〜H)
この第5の方法において、工程F〜工程Hは、第2、第3、または第4の方法において記載されるように(即ち、工程2F〜Hまたは工程3F〜Hまたは工程4F〜Hのように)行なわれ得る。]
[0116] EndoVは、DNA中のイノシンまたは損傷もしくは塩基誤対合の特定の部位の存在下でのみ切断するため、第5の方法のデオキシイノシンヘアピンアダプターは有利である。従って、標的核酸は、EndoV処理によって切断されない。従って、EndoV部位はアダプターに特有であるので、標的DNAは、いくつかの上述の態様におけるようなメチル化によって保護される必要がない。メチル化工程の排除は時間を節約し、標的DNAの不完全なメチル化に関連する問題が、排除される。さらに、EndoV消化は、EcoRI消化と比較して非常に迅速であり、従って、この方法を行なうために必要とされる時間を短縮する。]
[0117] デオキシイノシンヘアピンアダプターアプローチによって得られるペア読み取り結果の例を、図16に示す。大腸菌K12ゲノムDNAを、第5の方法に従って作製および配列決定した(図15)。ペア読み取り間の平均距離は、2070bp(標準偏差=594)であった。]
[0118] 第6の方法
さらなる態様において、ペアエンド配列決定は、図17および18に記載されるように、以下の工程の一部または全部を含む方法によって行なわれ得る。]
[0119] 工程6A−標的DNAの断片化(図17A)
第6の方法によれば、ゲノムDNAなどの、標的DNAサンプルのポリヌクレオチド分子は、約500塩基より長いか、約1000塩基より長いか、約2000塩基より長いか、約5000塩基より長いか、約10000塩基より長いか、約20,000塩基より長いか、約50,000塩基より長いか、約100,000塩基より長いか、約250,000塩基より長いか、約100万塩基より長いか、または約500万塩基より長い分子へと断片化される。好ましい態様において、フラグメントは、約1.5〜約5kb長の範囲にある。断片化は、本開示中の他の箇所において記載される任意の物理的および/または生化学的方法によって達成され得る。好ましい態様において、標的DNAは、物理的な力によって、例えば、HydroShear(登録商標)装置(Genomic Solutions)の使用によってランダムにせん断される。せん断されたDNAは、次いで、所望のフラグメントサイズに関して精製され得る。この任意のサイズ選択は、当技術分野において公知であり、本明細書中に開示される任意のサイズ選択法、例えば、電気泳動および/または液体クロマトグラフィーによって達成され得る。好ましい態様において、せん断されたDNAサンプルは、SPRI(登録商標)サイズ排除ビーズ(Agencourt; Hawkins, et. al., Nucleic AcidsRes. 1995 (23): 4742-4743)における精製によってサイズについて選択される。例えば、約2〜2.5kbのフラグメントの末端(対である)を配列決定することは、典型的な細菌ゲノム配列決定実験においてコンティグ順序付けを可能にし得る。より大きいフラグメントは、より高等な生物、例えば、真菌、植物および動物のゲノムの配列決定に有利であり得る。]
[0120] 工程6B−特定の制限酵素認識部位のメチル化(図17B)
下記に説明されるように、標的DNAフラグメントへのアダプターのライゲーションの後、アダプターは、環化の準備において1つまたは複数の制限酵素によって切断され得る。選択した制限酵素での標的DNAの消化を防止するために、標的DNAは、対応のメチラーゼでの修飾によって消化から保護される。好ましい態様において、アダプターは、ヘアピンアダプターであり、EcoRI制限部位を保有する(図18A)。従って、好ましい態様において、サンプルDNAフラグメント中に存在するEcoRI制限部位は、ライゲーションによる環化の前に、EcoRI付着末端がヘアピンアダプターから作製される場合、それらの完全性を保存するために、EcoRIメチラーゼを使用してメチル化される。]
[0121] 工程6C−フラグメント末端ポリッシュおよびリン酸化(図17C)
DNAの流体力学的せん断は、すり切れた末端(一本鎖突出)を有するいくつかのフラグメントをもたらす。平滑末端が、その後のアダプターライゲーションに好ましい。従って、任意で、すり切れた末端は、酵素的にDNAポリメラーゼを用いての「充填」および/またはエキソヌクレアーゼ(例えば、Mung Beanヌクレアーゼ)を用いての「チューイングバック(chewing back)」のいずれかによって、平滑にされ、ライゲーションの準備ができている状態にされ得る。有利には、いくつかのDNAポリメラーゼは、エキソヌクレアーゼ活性も有する。任意で、平滑化反応に続いて、好ましくはフラグメントの5’末端は、ポリヌクレオチドキナーゼによってリン酸化される。好ましい態様において、T4 DNAポリメラーゼおよびT4ポリヌクレオチドキナーゼ(T4 PNK)が、それぞれ、充填およびリン酸化のために使用される。T4 DNAポリメラーゼは、その5’→3’ポリメラーゼ活性によってDNAの3’陥凹末端(5’突出)を「充填する」ために使用され、一方、その一本鎖3’→5’エキソヌクレアーゼ活性は、3’突出末端を除去する。T4 PNKのキナーゼ活性は、5’ヒドロキシ末端へリン酸基を付加する。]
[0122] 工程6D−ヘアピンアダプターライゲーション(図17Dおよび図18A)
本発明によれば、二本鎖オリゴヌクレオチドアダプターは、標的DNAフラグメントの末端へライゲーションされる。好ましい態様において、アダプターは、ヘアピンアダプターである(図18A)。ヘアピンアダプターの1つの利点は、アダプター−アダプターライゲーション事象はアダプターダイマーのみを生じる、即ち、マルチマーアダプターコンカテマーの形成が防止されることである。さらに、それらのヘアピン構造は、ライゲーションされていないフラグメントを除去するために使用されるエキソヌクレアーゼ消化(工程6E)からサンプルフラグメントを保護する。図18Aに示される1つの好ましいヘアピンアダプターの設計は、EcoRIおよびMmeI制限部位を含む。EcoRIは、各フラグメントの末端上に付着末端を作製して(工程6F)、それらの環化を可能にする(工程6G)ために使用され得、MmeIは、その認識部位から20bp離れてDNAを切断するIIs型制限酵素であり;それは、環化されたサンプルフラグメントの末端に切込みを入れるために使用され、配列決定されるペアエンドタグが作製される。当業者は、EcoRIが、アダプターオリゴヌクレオチドのヌクレオチド配列の付随する変化と、標的DNAフラグメントの保護のための適切なメチラーゼの使用とを伴って、任意の多数の他のエンドヌクレアーゼによって置換され得ることを認識する。同様に、選択した酵素が、下流配列アセンブリを可能にするのに十分な長さのペア末端を作製するのに十分なその制限部位からの距離にて切断する限り、MmeIは、他のIIs型制限酵素によって置換され得る。好ましい態様において、ヘアピンアダプターは、例えば、図18Aに示される部位にてビオチン化される。他のビオチン化部位もまた、好適であり、当業者によって選択され得る。ビオチン部分は、ペアエンドアダプターのライゲーションの間、充填反応(フラグメント修復)の間、およびペアエンドライブラリーの増幅の間、アダプター含有ペアエンドフラグメントの任意の選択、およびペアエンドライブラリーフラグメントの任意の固定化(MmeI消化後)を可能にする。]
[0123] 工程6E−エキソヌクレアーゼ選択(図17E)
好ましくは、ヘアピンアダプターのライゲーションに続いてエキソヌクレアーゼ消化が行われ、両方の末端にヘアピンアダプターが適切に備えられていないDNAが除去され;SPRIサイズ排除ビーズにおける精製は、小さな望ましくない分子種、例えば、アダプター−アダプターダイマーを除去する。エキソヌクレアーゼ消化は、当技術分野において周知である種々のエキソヌクレアーゼの1つまたは複数によって行なわれ得る。好ましくは、消化は、3’→5’方向および5’→3’方向の両方において一本鎖DNAおよび二本鎖DNAの消化を同時に可能にする活性の組み合わせによって達成される。好ましい態様において、エキソヌクレアーゼ混合物は、大腸菌エキソヌクレアーゼI(3’→5’一本鎖エキソヌクレアーゼ)、ファージλエキソヌクレアーゼ(5’→3’一本鎖および二本鎖エキソヌクレアーゼ)、およびファージT7エキソヌクレアーゼ(5’→3’二本鎖エキソヌクレアーゼ、ギャップおよびニックにて開始し得る)を含有する。]
[0124] 工程6F−EcoRI消化(図17F)
好ましい態様において、EcoRIによるエンドヌクレアーゼ切断は、ヘアピンアダプター(図18A)を切断することによって各フラグメントの末端上に付着末端を作製するために使用され、フラグメントの環化が可能となる。EcoRIを用いての消化は、フラグメントの末端においてヘアピン構造を除去し、付着末端を残す。サンプルDNA中に存在する内部のEcoRI部位は、工程6Bにおいてより早くに行なわれたメチル化によって保護されている。]
[0125] 工程6G−環化(図17G)
次いで、フラグメントは、それらの付着EcoRI末端の分子内ライゲーション環化される。従って、ライゲーションの部位は、サンプルフラグメントの末端によっていずれかの側においてフランキングされた、2つの部分的なヘアピンアダプター(再構成されたEcoRI部位によって、頭部と頭部とが向かい合っている;合計44bp)を有する。別のエキソヌクレアーゼ消化が、環化されていないDNAを除去するために行なわれる。]
[0126] 工程6H−MmeI消化(図17H)
次いで、環化されたDNAフラグメントは、MmeIによって制限される。このIIs型制限酵素は、その制限部位から約20bp離れて切断する(2ntの3’突出を残す、即ちその切れ目は、20/18ntにある;前記酵素はまた、前記部位から19〜22bpの範囲の切れ目を有するいくつかの少数の産物を作製する)。MmeI部位は、サンプルDNAフラグメントへライゲーションされているヘアピンアダプターの末端に存在する(図18A);これらの部位における制限によって、ライゲーションされた「二重の」ヘアピンアダプター(44bp)とサンプルフラグメントの2つの20bp末端とを各々が含み、合計の長さが84bpの、ペアエンドDNAライブラリーフラグメントが作製される。]
[0127] 工程6I−ストレプトアビジンビーズによる単離(図17I)
ビオチンタグを欠いているので、ライゲーションされた「二重の」ヘアピンアダプターを有さないMmeI制限フラグメントは、任意で、この工程において排除され得る。ペアエンドフラグメントのライブラリーは、ストレプトアビジンまたはアビジンビーズへのヘアピンアダプター中に存在するビオチンタグの結合によって、固定化され得る(そして他のMmeI制限フラグメントから単離され得る)。]
[0128] 工程6J−ペアエンドアダプターライゲーション(図17J)
この工程において、工程6Hにおいて作製され、任意で工程6Iにおいて精製されたペアエンドライブラリーフラグメントの末端が、ペアエンドライブラリーアダプターまたはペアエンドアダプターと呼ばれる二本鎖アダプターにライゲーションされる(図18B)。これらのペアエンドアダプターは、増幅およびヌクレオチド配列決定の両方を支えるプライミング領域を提供し、さらに、454 Sequencing(商標)System上で十分に見つけ出すために有用な短い(例えば、4ヌクレオチド)「配列決定キー」配列を含み得る。アダプターは、「縮重」2塩基一本鎖3’突出を有し得る。縮重は、2つの突出する塩基がランダムである、即ち、それらが、各々、G、A、T、またはCのいずれかであり得ることを意味する。MmeI以外の酵素が使用される場合、当業者は、他の酵素と適合性であるペアエンドアダプターを容易に設計することができる。図18Bに示される例示的なアダプターは、ペアエンドライブラリーフラグメントへの指向性ライゲーションを強く選好するように設計され、各アダプターは、それらの3’末端に縮重2bp 3’突出を含み、これは、MmeIによって作製されたペアエンドライブラリーフラグメントの末端へ専らライゲーションし得る(但し、そのアダプターの5’末端は、リン酸化されていない。以下を参照のこと)。アダプターは、ペアエンドライブラリーフラグメントの利用を最大限にすること、およびペアエンドライブラリーフラグメントコンカテマーを形成する可能性を最小限にすることの両方のために、大過剰モルのアダプター(15:1のアダプター:フラグメント比)を含むライゲーション反応においてペアエンドライブラリーフラグメントと合わせられ得る。アダプター自体は、アダプターダイマーの形成を最小限にするために、リン酸化されていない場合があるが、結果として、ライゲーション産物は、充填反応(工程6K)によって続いて修復されなければならない。]
[0129] 工程6K−充填反応(図6K)
工程6Jにおいてライゲーションされたペアエンドアダプターがリン酸化されていない場合、ギャップが、ペアエンドライブラリーDNAフラグメントとのそれらの3’結合部に存在する。これらの2つの「ギャップ」または「ニック」は、鎖置換型DNAポリメラーゼを使用して修復され得、それによって、ポリメラーゼは、ニックを認識し、ニックを有する鎖を置換し(各アダプターの遊離3’末端へ)、ニックの修復および全長dsDNAの形成を生じさせる様式で鎖を伸長する。好ましい態様において、BstDNAポリメラーゼ(ラージフラグメント)が使用される。当技術分野において公知の他の鎖置換型DNAポリメラーゼ、例えば、phi29 DNAポリメラーゼ、DNAポリメラーゼI(クレノウフラグメント)、またはVent(登録商標)DNAポリメラーゼもまた、この工程に好適である。]
[0130] 工程6L−増幅(図6L)
任意で、「アダプター付加」ペアエンドDNAライブラリーは、増幅され得る。好ましくは、増幅は、PCRによって行なわれるが、当技術分野において公知のおよび/または本明細書中に記載の他の核酸増幅法もまた、使用され得る。好ましくは、図18Bに示されるF-PCRおよびR-PCRのオリゴヌクレオチドが、PCRプライマーとして使用され得る。]
[0131] 次いで、「アダプター付加」ペアエンドDNAライブラリーは、増幅された(上の段落に記載されるように)かどうかにかかわらず、配列決定される。好ましくは、ライブラリー由来の個々の分子が、配列決定される。選択されたDNA配列決定法が、各個々の配列決定反応において複数の同一の鋳型分子を必要とする場合、ライブラリー由来の個々の分子は、クローン増幅され得る。好ましくは、クローン増幅は、参照により各々が全体として本明細書に組み入れられる、国際特許出願第WO 2005/003375号、第WO 2004/069849号、第WO 2005/073410号に記載されるようなビーズエマルジョンPCRによって行なわれる。]
[0132] 第7の方法
なお別の態様において、ペアエンド配列決定は、図21〜25に示されるように、以下の工程の一部または全部を含む方法によって行われ得る。]
[0133] 記載の態様は、特に有利で、独創的な方法を提供し、これは、ライゲーションによる環化の代替法を提供し、上述の方法およびバリエーションの一部または全部による実施に適用できる。さらに、現在記載の態様は、10Kbまたはそれよりも長い(即ち、約20Kbのペアエンド距離について)のペアエンド距離を作製するのに特に効率的であり、しかし、記載の組換えに基づくストラテジーは、10Kbよりも短い(即ち、約3Kb、または8Kbのペアエンド距離について)フラグメントを環化するためにも有用であることも認識される。現在記載の態様は、より長いペアエンド距離について所望の配列長を含む核酸分子の環化についての分子内組換えに基づくストラテジーを使用し、核酸分子、特に、大きな核酸分子の環化についての効率において実質的な利点を提供する。]
[0134] ある好ましい態様は、直鎖状アダプター付加標的フラグメントを環化し、標的フラグメントを含む環状核酸と、ハイブリッドアダプター配列を含む第2の切除化直鎖状フラグメントとを生成するために、Cre/Lox型部位特異的リコンビナーゼ(以下、「SSR」と呼ぶ)システムを使用する組換え反応方法によるインビトロ切除と呼ばれるものを含み、このような方法の一例を図21に示す。例えば、図21は、10Kbまたはそれより長いペア距離を有する配列決定可能なペアエンド鋳型核酸分子のライブラリーを生成するためのSSRに基づくストラテジーの例示的な概観を提供する。下記においてより詳細に説明するように、図21は、ゲノムまたは他の所望のDNAを断片化し、アダプター2105および2107を取り付け、アダプター付加フラグメント2100を生成し、次いで、これを所望の長さについて選択する方法を示す。アダプター付加フラグメント2100から環状産物2150および直鎖状産物2155を生成するSSR組換え工程も示され、ここで、環状産物2150が機械的にせん断され、直鎖状ペアエンド鋳型2160が生成され、これが続いて増幅され、鋳型2160の多くの実質的に同一のコピーを含む集団2170が生成される。]
[0135] Cre/Loxを使用するSSRシステムの態様が本明細書に記載されているが、当業者は、Int/attおよびFLP/FRTなどのインテグラーゼファミリーの他のメンバーもまた使用され得、従って、Cre/Loxの開示が限定として考えられるべきではないことを認識する。さらに、前記方法は単一の分子によって一般的に説明されているが、前記方法は、同一のまたは同様の反応環境、例えば、本明細書中の他の箇所に記載の油中水型エマルジョンリアクター中において同時に実質的に多数の分子に対して行われ得、ここで、各反応環境中の標的分子の数は、単一の分子、または数十、数百、数千、数百万などの分子のオーダーであり得ることが認識される。例えば、本明細書の他の箇所に記載の油中水型エマルジョンストラテジーを使用することは、分子間事象(即ち、コンカテマーの形成など)を阻害し、所望の分子内組換えを促進し、下記に詳細に記載した環化産物を生じさせる。]
[0136] 工程7A−断片化
上記の種々の態様において説明したように、標的DNAサンプルのポリヌクレオチド分子の生ゲノムまたは他の供給源が、約10,000塩基より長いか、約20,000塩基より長いか、約50,000塩基より長いか、約100,000塩基より長いか、約250,000塩基より長いか、約100万塩基より長いか、もしくは約500万塩基より長い分子へ断片化される。ある好ましい態様において、フラグメントの長さは、約10Kb〜約50Kb、〜約100Kb、または〜100Kbよりも長い範囲にある。断片化は、本開示中の他の箇所において記載される任意の物理的および/または生化学的方法によって達成され得る。好ましい態様において、標的DNAは、物理的な力によって、例えば、HydroShear(登録商標)装置(Genomic Solutions)の使用によって、ランダムにせん断される。しかし、選択される方法が所望のフラグメント長を生成することができるならば、本明細書に記載されるフラグメントを作製する任意の方法が使用され得ることが認識される。]
[0137] 工程7B−末端ポリッシュ
現在記載のバリエーションにおいて、フラグメントの各々の末端は、本開示中の他の箇所において記載の任意の方法、例えば、上記の工程6Cに記載の方法を使用してポリッシュされ得る。記載したように、その後のアダプターライゲーションのために平滑末端が好ましい。従って、任意のすり切れたまたは突出した末端が、DNAポリメラーゼを用いての「充填」および/またはエキソヌクレアーゼ(例えば、Mung Beanヌクレアーゼ)を用いての「チューイングバック」のいずれかによって、酵素的に平滑にされ、ライゲーションの準備ができている状態にされ得る。有利には、いくつかのDNAポリメラーゼは、エキソヌクレアーゼ活性も有する。任意で、平滑化反応に続いて、好ましくはフラグメントの5’末端は、ポリヌクレオチドキナーゼによってリン酸化される。好ましい態様において、T4 DNAポリメラーゼおよびT4ポリヌクレオチドキナーゼ(T4 PNK)は、それぞれ、充填およびリン酸化のために使用される。T4 DNAポリメラーゼは、その5’→3’ポリメラーゼ活性によってDNAの3’陥凹末端(5’突出)を「充填する」ために使用され、一方、その一本鎖3’→5’エキソヌクレアーゼ活性は、3’突出末端を除去する。T4 PNKのキナーゼ活性は、5’ヒドロキシ末端にリン酸基を付加する。]
[0138] 工程7C−アダプターライゲーション
やはり上述したように、標的DNAフラグメントのポリッシュされた末端へ二本鎖オリゴヌクレオチドアダプターがライゲーションされる。現在記載の態様において、アダプターは、loxPアダプターを含み得、この例は、図22に示される。例えば、図22は、2つの二本鎖アダプター化学種、loxP-6Fアダプター2105およびloxP-6Rアダプター2107の説明のための例を提供し、各々は、5'リン酸を欠く第1の平滑末端と、リン酸化5'末端および3つの配列位置の3'突出を有する第2の末端とを有する。当業者は、記載の3'突出が3つの配列位置に限定されないこと、および所望の条件に応じて3つよりも多いまたは3つよりも少ない場合があることを認識する。]
[0139] アダプター2105および2107の第1の平滑末端は、標的DNAフラグメントのポリッシュされた(即ち、平滑)末端へライゲーションされ、その結果、各アダプター中のlox P 2200領域が、下記に詳細に説明されるように環化産物を促進するために、同一の方向性配向となる。さらに、各アダプターの5'リン酸化および突出を含む両方のアダプター化学種の第2の末端は、特定の利点を提供する。第1の利点は、上記に説明されるようなアダプターコンカテマーの分子を生成するマルチマーアダプター形成の阻害である。換言すれば、アダプター2105および2107の平滑末端のみが互いにライゲーション可能であり、このようなアダプターライゲーション事象をダイマーの形成に限定し、これは、アダプター付加標的分子から識別することがより困難であり、場合によっては、有意な割合のアダプター分子を消費して標的分子へのライゲーションにそれらを利用不能にする、長いコンカテマーとは対照的である。第2の利点は、5'リン酸化および3'突出は、各々、エキソヌクレアーゼ分解の効率を改善し、従って、下記にさらに詳細に説明される環化されていない分子の除去を改善することである。]
[0140] 工程7D−サイズ選択
次に、アダプターがライゲーションされた核酸フラグメント2100は、所望のフラグメントサイズに関して精製され得る。この任意のサイズ選択工程は、当技術分野において公知でありかつ本明細書に開示される任意のサイズ選択法、例えば、電気泳動および/または液体クロマトグラフィーを使用して行われ得る。一態様において、せん断されたDNAサンプルは、上述のようにゲル電気泳動によってサイズについて選択される。記載の態様において、ゲルに基づく方法は、所望の長さの25%の範囲といった一定の所望の長さを有する長さのサイズ分布を含む、サイズ分画されたDNAフラグメントを生成する。例えば、標的化される20Kbサイズフラクションは、20Kb+/−5kbであるフラグメントのプールを作る(即ち、15Kb〜25Kbフラグメント長の範囲を作る)。同一または他の態様において、代替のサイズ分画技術が使用され得、特にここで、より長いフラグメントがペアエンド距離を増加させるために望ましい。より長い分子のサイズ分画に適用できる1つのこのような技術は、一般的に、「パルスフィールドゲル電気泳動」と呼ばれる(本明細書以下においてPFGEと呼ばれ、Schwartz DC, Cantor CR. Separation of yeast chromosome-sized DNAs by pulsed field gradient gel electrophoresis. Cell. 1984 May;37(l):67-75によって記載され、これは、全ての目的について参照によりその全体が本明細書に組み入れられる)。PFGEは、標準ゲル電気泳動法によって達成可能であるよりも遥かに大きな分解能で大きなサイズの分子のサイズ分画を可能にする。例えば、当業者は、標準ゲル電気泳動法は、一般的に、大きな分子、特に、約20Kbまたはそれより長い配列長を有する核酸分子を効率的にサイズ分離することにおいて無効であることを認識する。他方で、PFGE法は、このような大きな核酸分子について正確なサイズ識別を提供する。]
[0141] さらに、標準ゲル電気泳動法またはPFGE法のいずれかを使用する態様において、ポリアクリルアミドまたはアガロースゲルからの核酸またはタンパク質分子の効率的な抽出のために、当業者に公知の「電気溶出」法と呼ばれるものを使用することが、時には望ましい。]
[0142] ある態様において、本明細書中の他の箇所に記載の方法、例えば、工程6Kで記載の方法を使用して、上述のアダプターライゲーション工程から残されたギャップを充填することが、重要である。]
[0143] 工程7E−組換えによる環化
次に、直鎖状アダプター付加核酸配列フラグメント2100が、標的核酸配列の末端へライゲーションされこれにフランキングしているアダプター2105および2107中の34bp loxP領域2206を認識するCreリコンビナーゼ酵素などの部位特異的リコンビナーゼへ曝露される。アダプターloxP領域2206(下記においてさらに説明)の同一の方向性配向を含むアダプター付加フラグメントについて、Creリコンビナーゼは、loxP領域のハイブリッドを含む短い直鎖状フラグメント(直鎖状産物2155として図21に示される)を切除し、標的核酸を環化し、第2のハイブリッドloxP領域と標的核酸とを含む環状分子(環状産物2150として図21に示される)を生成する。例えば、図21および23は、Creリコンビナーゼによって作製された直鎖状産物2155および環状産物2150として、両方の組換え産物を示す。図22は、環化産物2150中に存在するハイブリッドloxP領域2208を有する組換えられたアダプター2110の組成をさらに示す。当業者は、Creリコンビナーゼ酵素が、アダプター2105および2107の両方におけるloxP領域2206内で切断し、組換えて、オリジナルのアダプター2105および2107の両方由来の領域2206のハイブリッドであるloxP領域を有する産物を形成することを認識する。例えば、Creリコンビナーゼ酵素は、6F 2105および6R 2107アダプターの各々のloxP領域2206において結合し、同一の配列位置で各々を切断する。結合されたリコンビナーゼ/核酸複合体は、アダプター付加標的核酸配列フラグメントの各末端に配置され、互いと反応し、6F 2105および6R 2107アダプター由来の切断末端が一緒に合わされ、従って、核酸フラグメントが環化される。この例において、リコンビナーゼ酵素は、8bp方向配列2200を欠く6F 2105アダプターから切断されたセグメントと、8bp方向配列2200を含む6R 2107アダプターのセグメントとを合わせ、環状産物2150を生じさせる。さらに、6F 2105アダプター由来の8bp方向配列2200エレメントは、8bp方向配列2200を欠く残りの6R 2107アダプターへ合わされ、上述の直鎖状産物2155において短いハイブリッドアダプターが生じる。環状産物2150中の得られたハイブリッドアダプターを、loxP領域2208を含むアダプター2110として図22中に示す。領域2208の態様は、loxP領域2206と本質的に同一である配列組成を含み、環状産物2150中のアダプター2110の領域2208はまた、濃縮タグ2205の2つの関連の態様を含む(1つのタグは、アダプター2105および2107の各々に由来する)。ある態様において、濃縮タグ2205の2つの態様の存在は、その後の濃縮工程の効率を改善する。図22に示されるように、濃縮タグはビオチンを含み得、しかし、本明細書に記載される(即ち、結合対)かまたは当技術分野において一般的に公知である任意のタイプの濃縮タグが使用され得ることが認識される。アダプター2110はまた、環状産物2150中の標的DNAフラグメントへライゲーションされたオリジナルのアダプター2105および2107由来の平滑末端を含むことも注意される。]
[0144] 図22および23は、SSRプロセスから環化産物を作製するためのloxP部位の方向性の重要性の例を提供する。図22の例において、loxP領域2206の野生型バージョン(配列領域の周りのボックスによって示される)が、アダプター2105および2107と関連している。しかし、SSR機能性が保持される限り、他の突然変異体が使用され得ることが認識される。さらに、当業者は、記載のSSRシステムにおいて、loxP領域は方向性特徴を有すること、およびこのような特徴は、Creリコンビナーゼへ曝露された場合に産物に影響を及ぼすことを認識する。図22の例において、6Fアダプター2105および6Rアダプター2107の両方の領域2206は、長さが8bpである方向loxP配列2200を含むCre/Loxシステムに典型的な特徴を含む(方向性は配列2200と関連する矢印によって示される)。さらに、領域2206は、方向配列2200の各サイドにフランキングする約13bpのパリンドローム配列エレメントを含む。]
[0145] 図23は、loxP領域2206の相対的な方向性配向に基づいて作製されたSSR産物の例示的な例を提供する。まず、図23Aは、反対方向関係に向けられた2つのloxP領域2206を有するアダプター付加フラグメント2100'、および、Creリコンビナーゼによって作製された直鎖状反転産物2305(影付きの領域2300の位置の変化によって示される)の代表的な図解を提供する。全く異なることに、図23Bは、同一方向関係に向けられた2つのloxP領域2206を有するアダプター付加フラグメント2100"の出現、ならびに、(上述のような組換えられたアダプター2110中に)領域2208を含む第1の環状産物2150と、アダプター付加フラグメント2100から切除され、第2の組換えられた領域2208を含む、第2の直鎖状産物2155とを含む、Creリコンビナーゼによって作製された産物を提供する。図23Bの組換え反応は、方向矢印によって示されるように「二方向性」であることが認識され、ここで、切除矢印2334は、組込み矢印2336によって示される組込み方向と比較した場合、反応の方向の大きさがより大きいことを示している。当業者はまた、矢印2334および2336が、例示目的のみのために提供され、反応条件に少なくとも一部分依存し得る方向性の実際の大きさの正確な規模まで描かれていないことを認識する。重要なことに、好ましい態様において、反応条件は、切除方向および環状産物形成を促進するように最適化される。]
[0146] 工程7F−非環状核酸の除去
続いて、切除された産物2155、反転された産物2305、アダプターダイマー、アダプター付加されていない標的核酸フラグメントなどを含む、全ての直鎖状核酸分子が、本明細書中の他の箇所に記載の任意の方法を使用して除去され得る。例えば、エキソヌクレアーゼ処理ストラテジーが、直鎖状核酸分子産物または他の残りの直鎖状フラグメントの全てを効果的に除去するために使用され得る。]
[0147] ある態様において、望ましくない直鎖状核酸分子の除去の効率を高めるために、2つ以上のタイプのエキソヌクレアーゼを使用することが望ましい場合がある。例えば、ある態様において、2つまたはそれ以上のエキソヌクレアーゼ化学種が使用され得、これらとしては、エキソヌクレアーゼ1(EXO 1とも呼ばれ得る)エキソヌクレアーゼ化学種、および直鎖状二本鎖DNAを消化するためのATP依存性DNAseと呼ばれるもの(即ち、例えば、Epicentre Biotechnologies, Madison WI製のPlasmid-Safe(商標)ATP依存性DNase)が挙げられるが、これらに限定されない。]
[0148] 工程7G−直鎖状化
次いで、環状核酸産物2150は、本明細書中の他の箇所に記載の任意の種々の方法を使用して、中間にアダプター領域を有するオリジナルの標的核酸由来の末端領域を含む直鎖状核酸分子を作製するために、断片化され得る。現在記載のバリエーションにおいて、好ましいフラグメント長の選択を可能にし、かつ、対のタグの1つまたは複数についてより長い配列長を有するペアのタグの形成を促進する噴霧化などの、機械的せん断タイプの方法の1つを使用することが、特に有利であり得る。]
[0149] また、図22に示されるアダプターエレメントは、MmeIまたは本明細書中の他の箇所に記載されている他のIIs型制限部位を欠いているが、しかしこのような部位が含まれ得ることが容易に認識されることに注意することが重要である。実際に、ある態様において、MmeI部位をアダプター化学種の1つと結合させることが有利であり、その結果、核酸フラグメントが両方のアダプター化学種へライゲーションされて環化されると、今度は直鎖状フラグメントの一方の末端に20bpタグを残して環状分子を切断するために、MmeI酵素が使用され得る。次いで、直鎖状フラグメントは、下記および本明細書中の他の箇所においてより詳細に説明される、機械的な手段を使用して再び断片化され得、ここで、機械的な断片化は、20bpタグと34bp loxP領域との組み合わせよりも実質的により長い特定のフラグメント長について選択する。結果として、第1のものよりも長い長さのペア中の第2のタグ、および、アダプター2110を含む介在領域内での断片化の可能性の実質的な減少をもたらす。ペア中の第2のタグの好ましい長さは、得られたペアエンドフラグメントについての配列データを作成するために使用される配列決定法の平均または総読み取り長さ能力に、少なくとも一部分、基づき得る。]
[0150] ある態様において、その後の精製工程の間に、少量でおよび/または低品質で存在し得る貴重な標的DNAフラグメントを不注意で損失することを防ぐために、キャリアDNAがさらに直鎖状化工程の前に添加され得る。MmeIなどのII型制限部位を使用する記載の態様において、本明細書中の他の箇所に記載されるようなMmeIキャリアDNAを使用することが有利であり得る。]
[0151] 同一または代替の態様において、他の目的のために他のタイプのキャリアDNAを使用することもまた有利であり得、これは、特定の適用についてより好適であり得る。1つのこのような目的としては、上述の直鎖状化工程などの機械的操作工程の効率の分析が挙げられる。ある態様において、本明細書に記載される噴霧化の方法などの、機械的な断片化方法の効率を評価することが望ましく、ここで、ペアエンド鋳型2160は、この効率の有効な測定に十分な量では生成されない。従って、断片化工程の前にいくらかの環状キャリアDNAを添加することによって、断片化産物の量を増加させることが望ましい。しかし、このようなキャリアDNA産物は、サンプル中にプールされると、ペアエンド鋳型2160と区別できない。このような態様において、機械的分析工程が行われた後に、キャリアDNAの配列決定可能な量を制限することがさらに有利である。換言すれば、機械的操作工程の分析のためにキャリアDNAを使用することは有益であるが、配列決定プロセスから貴重な資源を消費して、関心対象ではないキャリアDNAから配列情報を作成することは、一般的に望ましくない。キャリアDNAの配列決定可能な量を制限するための1つの手段は、それをPCRまたは他の増幅方法によっては増幅不能にすることである。従って、ペアエンド鋳型2160などの、直鎖状化された産物のプールが配列決定のためにさらに増幅される態様において、キャリアDNAの全体的な出現は、集団2170として示される配列決定可能な鋳型の増幅された集団において実質的に低減される。例えば、下記により詳細に説明されるように、環状キャリアDNA、例えば、pUC 19は、具体的には、ピリミジンダイマーを作ることによって鎖を架橋し、それを増幅不能にするのに有効な短波長紫外線で処理されてもよく、その結果、それが最終サンプル中において実質的に示されず、配列決定されない。処理されたキャリアDNAは、環化された標的DNA(即ち、環状産物2150)を有するサンプルへ添加され得、直鎖状化され得、その結果、サンプルは、標的(即ち、ペアエンド鋳型2160)およびキャリアDNA集団の両方からの直鎖状化された代表物を含む。この例において、例えば、Agilent Technologies, inc.製のLabChip DNA 7500チップを使用することによって、直鎖状化の効率を測定するためにサンプル全体が分析され得、ここで、キャリアDNAは、核酸体積の増加に起因してより正確な測定を可能にする。本明細書に記載の任意の方法を使用するサンプルのその後の増幅において、キャリアDNAのコピー数は増加せず、標的DNA分子の割合が実質的により大きな、増幅されたサンプルが生じる。]
[0152] 工程7H−濃縮
さらに、各アダプター化学種と結合された濃縮タグ2205の態様が図22に示され、これらとしては、ビオチンタグ、または本明細書中の他の箇所に記載のもしくは当技術分野において一般的に公知の他のタイプの濃縮タグが挙げられ得る。上述したように、ビオチン部分などの濃縮タグは、アダプター含有ペアエンドフラグメントの任意の選択、ならびに、ペアエンドアダプターのライゲーションの間、充填反応(フラグメント修復)の間、およびペアエンドライブラリー増幅の間、ペアエンドライブラリーフラグメントの任意の固定化(環状核酸の直鎖状化の後)を可能にする。本明細書に記載のloxPアダプター2105および2107のさらなる利点は、アダプター−アダプターライゲーション事象が、アダプターダイマーのみへ至る、即ち、マルチマーアダプターコンカテマーの形成が防止されることである。]
[0153] 本発明の方法7のバリエーションの他の局面は、例えば、本願においてこれも記載される、アダプターのライゲーションおよび産物のその後の配列決定を伴う増幅に関する、第6の方法の工程J〜L(工程6J〜6L)などの、本明細書に記載の他の方法およびバリエーションと一致する。]
[0154] 前述したように、方法7のバリエーションは、図25に示されるように、最小数の配列読み取りでゲノム足場を効率的にカバーする能力において、他の方法と比べて実質的な利点を提供する。例えば、図25は、約20Kbの長いペアエンド読み取りが、大腸菌K12ゲノム足場のアセンブリにおいて、約3Kbのより短いペアエンド読み取りと比べてもたらされる実質的な利点、および周知のショットガンに基づくアプローチと比べてなおより大きな利点を示す。方法7は、技術者の時間、機器の時間および使用、ならびに試薬の使用などの少ない貴重な資源を必要とするプロセッシング工程の必要性が少ないため、ライゲーションに基づく方法に比べて他の利点を提供する。]
[0155] 上述の7個の方法の対応する工程の任意の組み合わせもまた企図され、本発明に包含されることが、理解される。]
[0156] 上記の開示から理解され得るように、方法1、2、3、4、5および6の間には類似性が存在する。特に、方法2、3、4、5および6の類似する工程は、特に類似しており、等価なまたは好ましい結果をもたらすために、前記方法の間において、組み合わせても入れ替えてもよい。]
[0157] ペアエンド配列決定の一般的な方法を記載したので、方法のバリエーションを記載する。]
[0158] 1つのバリエーションにおいて、ヘアピンアダプターは、突出アダプターによって置換され得る(図8)。突出アダプターは、ビオチン化され得、例えば、以下の配列を有し得る:]
[0159] 上の鎖(SEQID NO:28)の3’末端の6個のヌクレオチド(即ち、TCCAAC)は、下の鎖(SEQ ID NO:29)の相補ヌクレオチドと組み合わさって、IIS型制限酵素MmeIに対する認識部位を形成する。]
[0160] バリエーションは、方法3と同様の様式で行われる。第1のゲノムDNA(図8A)は、断片化およびポリッシュされ(図8B)、突出アダプターが、フラグメントの末端へライゲーションされる(図8C)。突出アダプターのダイマーは、サイズ分画クロマトグラフィー(即ち、スピンカラム)または電荷ベースのクロマトグラフィーによって除去され得る。突出アダプターのより高次のコンカテマーは、5’突出におけるリン酸の欠如に起因して、形成され得ない。突出プライマーダイマーの除去後(図8D)、フラグメントは、キナーゼを用いた処理によって、自己ライゲーションが可能になる(図8E)。自己ライゲーション(即ち、環化)が行なわれ、続いて、ライゲーションされていない非環状DNAを除去するために、エキソヌクレアーゼ消化が行われ得る。突出アダプターへライゲーションされないDNAフラグメントは、ポリッシュに起因して平滑末端を有するので、それらは、各サイドにおいてライゲーションされた2つの突出アダプターを有するフラグメントの5’突出末端(粘着末端)と同程度に効率的にライゲーションするとは予想されない。環化の後、MmeI消化が、突出アダプターより遠位のDNAを除去し(図8Fを参照のこと)、ライゲーションされた突出アダプターの各サイド上のオリジナルのゲノムDNAのうちの約20塩基を残す(図8G)ために使用される。突出アダプターを有するフラグメントは、ビオチン化されたアダプターへ結合するストレプトアビジンビーズを使用して精製される(図8H)。]
[0161] 得られたフラグメントは、例えば、本開示において提供される方法(例えば、工程3H)のなどの利用可能な任意の方法によって配列決定され得る。]
[0162] 本発明の方法によって作製された核酸は、配列の末端に相補的な1つまたは複数のプライマーを使用して配列決定され得る。即ち、工程3Hに記載される配列決定プロトコルにおいて、配列決定アダプターAおよび配列決定アダプターBが、フラグメントが配列決定される前にフラグメントの末端にライゲーションされる。フラグメントの末端配列は配列決定アダプターAまたはBのいずれかであることが既知であるので、配列決定アダプターAまたはBに相補的な配列決定プライマーが、フラグメントを配列決定するために使用され得る。さらに、ライゲーションされたアダプターを含む、各フラグメントの中間にある配列は、既知である(例えば、図7の703を参照のこと)。配列決定はまた、この中間領域に相補的なプライマーを使用して中間から始まり得る。さらに、末端領域由来の配列決定プライマーおよび中間領域由来の配列決定プライマーは、同時に、配列決定されるフラグメントへハイブリダイズされ得る(図9を参照のこと)。一方のプライマーは、保護されるが、他方のプライマーは、保護されない。図9において、末端にハイブリダイズされたプライマーは、リン酸基によって保護される。配列決定の第1ラウンドは、保護されていないプライマー(図9、中間プライマー)から始まる。配列決定の第1ラウンドの後、第1のプライマーの伸長は、任意で、例えば、相補ジデオキシヌクレオチドの組み込みによって終結され得る。あるいは、第1のプライマーの伸長は、鋳型鎖の末端へと進み、終結を不必要とし得る。第2の保護されたプライマーは、フラグメントの末端から配列を決定するために、配列決定の第2ラウンドにおいて脱保護および伸長され得る。この方法は、一本鎖であり得る単一の鋳型からの2つの長いペアエンド配列決定読み取りを可能にする。]
[0163] 第2のバリエーションにおいて、断片化された出発DNA(図10A)は、3’CC突出および任意の内部のIIS型制限エンドヌクレアーゼ部位を有するアダプターへライゲーションされる。ライゲーションされたフラグメントは、末端が適合性ではない(相補的でない)ため、自己ライゲーションも自己環状もし得ない。しかし、これらのフラグメントは、両サイドに5’GG突出を有するリンカーを使用してライゲーションされ得る(図10B)。ライゲーション後、核酸フラグメントは、上記で考察された標準的なゲルおよびカラムクロマトグラフィーによって、または環化されていない分子を切断するエキソヌクレアーゼ消化によって、非環状DNAから精製され得る。得られた環状DNA(図10D)は、他の方法におけるようにMmeIによって切断され得、得られたDNAが配列決定され得る。]
[0164] 別のバリエーションにおいて、本発明の方法は、A/Bアダプター付加ssDNAを生成するために、使用され得る(図11、工程1)。この一本鎖フラグメントは、A/Bアダプターに相補的な配列を含むオリゴへのハイブリダイゼーションによって環化され得(図11、工程2)、リガーゼの存在下においてライゲーションされ得る。ライゲーションを促進することに加えて、前記オリゴは、環化されたssDNAのローリングサークル増幅を促進するために、プライマーとして使用され得る(図11、工程3)。ローリングサークル増幅されたDNAは、方法1、工程1KおよびL(図1LおよびM)について記載されたように切断され得る。増幅の後、標準的なライブラリー作製および配列決定技術が、産物に適用され得る(図11、工程4)。]
[0165] 本発明のある態様は、実験プロトコルが本明細書に記載の方法に従うMmeI切断の使用を含んだ、大腸菌株K12ゲノムのペアエンド配列決定実験において、ゲノムにわたる読み取り範囲の深さが大きく変化したという驚くべき知見に基づく(図20、「キャリア無し(−)」)。深さによって、ゲノムの実質的に同一の領域への配列読み取りマッピングの数が意味される。この深さバリエーションは、ゲノムにわたるMmeI部位の密度に相関した(図20)。予想外かつ驚くべきことに、本発明者らは、MmeI部位を含むことが既知である二本鎖DNA(図20において「(+)」と示される)、即ち、大腸菌B株DNA(「EcoliBStrain(+)」)、サケ精子DNA(「SalSprmDNA(+)」、またはMmeI部位を含むことが既知であるPCR増幅産物(「AmpPosMmeI(+)」))の付加が、ゲノムにわたる範囲の深さのバリエーションを大幅に減少させ、ランダム化したことを発見した。しかし、MmeI部位を欠く二本鎖DNA(図20において「(−)」と示される)、即ち、ポリ(dIdC)(「dIdC(-)」)、またはMmeI部位を含まないことが既知であるPCR増幅産物(「AmpNegMmeI(-)」)の付加は、「キャリア無し」コントロールと比較して、ゲノムにわたる範囲の深さのバリエーションのパターンを変化させなかった。従って、MmeIポジティブキャリアDNAの使用は、ゲノムにわたるペアエンド読み取りのより一様な分布を提供し、これは有利である。これらの驚くべき知見は、以下の表に示されるデータによってさらに実証される。]
[0166] (表1)ペアエンド読み取りの深さ分布および長さに対するMmeIキャリアDNAの効果]
[0167] 表1は、大腸菌K12についての深さの範囲の統計を示す。上部3つのサンプル(行)には、MmeIポジティブキャリアDNAが添加され、一方、下部3つのサンプルには、MmeIネガティブキャリアDNAが添加された。列の見出しは、以下を示す:「Depth Ave」=平均の深さ;「DepthSTDEV」=深さの標準偏差;「Depth%CV」=Depth Aveによって除算されたDepth STDEV(この商は、平均の深さによって補正された深さにおけるバリエーションを示す);「Length Ave」=ゲノムにおけるペア読み取りの平均距離;「LengthSTDEV」=ゲノムにおけるペア読み取りの距離の標準偏差;「Length%CV」=Length Aveによって除算されたLengthSTDEV。]
[0168] 表1は、図20に従って、大腸菌K12ゲノムにわたる範囲の深さにおけるバリエーションがMmeIポジティブキャリアDNAの添加によって大幅に低下したことを示す(DepthSTDEVおよびDepth %CVの値を参照のこと;より小さなDepth STDEVおよびDepth %CV値が、有利である)。これは、ゲノムにわたるペアエンド読み取りのより一様な分布をもたらす。この一様な分布は有利である。]
[0169] (表2)大腸菌K12のゲノム足場に対するMmeIポジティブキャリアDNAでのペアエンド配列決定の効果]
[0170] 表2は、ショットガンコンティグの足場に対するMmeIポジティブキャリアDNAによって得られたペアエンド配列決定データの効果を示す。GS20配列決定装置(454 Life Sciences, Branford, CT, USA)における大腸菌K12ゲノムDNAのショットガン配列決定によって得られた121の大きなコンティグが、ペアエンド配列決定読み取りによってアセンブリされた場合、より低い数(19〜25)の足場(即ち、より大きい足場)が、キャリアDNAを用いずにもたらされたまたはMmeI部位を欠くキャリアDNA(48〜56の足場)によってもたらされたペアエンド配列決定の読み取りと比較して、MmeIポジティブキャリアDNA(列「StratageneSSdsDNA (+)」、「大腸菌B株(+)」および「増幅されたポジティブ(+)」)によってもたらされたペアエンド配列決定読み取りから生じた。従って、MmeIポジティブキャリアDNAの使用は、本発明に従って行われるペアエンド配列決定によって達成されるゲノムアセンブリ性能を改善する。]
[0171] 上述したように、本発明のある態様は、二本鎖「キャリアDNA」の使用を包含する。ある態様において、キャリアDNAは、制限エンドヌクレアーゼMmeIによるDNA切断を含む工程において使用される。前記態様において、キャリアDNAは、1つまたは複数のMmeI部位を含有する。MmeIによるエンドヌクレアーゼ切断は、MmeI酵素分子のモル数がDNAサンプルに存在するMmeI部位のモル数とほぼ等しい場合、最も効率的に生じる(New England Biolabs, Ipswich, MA, USAの製品カタログ)。本発明の方法において、MmeI部位の数は、確実に測定するのが困難でありかつ時間がかかる低いDNA濃度(代表的に、数ナノグラム〜数十ナノグラムのオーダーである)に起因して、およびまた、配列決定される標的DNAに基づくMmeI部位の数におけるバリエーションに起因して、推定することが困難であり得る。従って、(化学量論的濃度を達成するように)反応に添加されるMmeI酵素の量の正確な計算には、問題がある。この困難性を克服し、MmeI部位の数とMmeI酵素分子の数との均衡に対する必要性を満たすために、本発明のいくつかの方法は、(サンプルDNAに関して)過剰のキャリアDNAの添加を包含する。この方法において、反応に添加されるMmeI酵素の量が、既知量のキャリアDNAに基づいて算出され得、一方、(環状)サンプルDNA中のMmeI部位の数は、無視可能となる。従って、サンプルDNAのDNA濃度の測定は、不必要となる。これは、速度を改善し、本方法に必要とされるコストおよび時間を減少させる。キャリアDNAの量は、サンプルDNAの量を、数倍〜約10倍、〜約100倍、〜約1000倍、またはそれ以上、上回ってもよい。好ましい態様において、2マイクログラムの音波破砕された二本鎖サケ精子DNAは、100マイクロリットルの体積において、2ユニットのMmeIおよび全ての必要とされる試薬(例えば、1×NEBuffer 4(New England Biolabs)および50μMのS-アデノシルメチオニン(SAM))と共にサンプルDNAに添加され、そして約37℃にて約15分間インキュベートされる。当業者は、反応温度および持続時間が実用的な範囲内で調節され得ることを認識する。]
[0172] 上述されるような、ほぼ化学量論的量のMmeI酵素と組み合わせての、MmeI制限消化における過剰のMmeI部位含有キャリアDNAの使用は、本開示において、例えば、第6の方法の工程6H(図17H)において記載されるMmeI消化を含む任意の方法に任意で組み入れられ得る。当業者はまた、MmeI部位を含む「キャリアDNA」を添加するストラテジーが、任意のMmeI制限消化反応において、特に、サンプルDNA量が低いおよび/またはサンプルDNA中のMmeI部位の数が未知である反応において、有用であることを認識する。]
[0173] キャリアDNAのさらなるいくつかの態様は、サンプルの機械的操作の分析のために使用され得、ここで、キャリアDNAがプロセスの他の工程と干渉しないことが望ましい。他のこのようなプロセスは、DNAサンプルの増幅であり、ここで、環状キャリアDNAは、DNAを増幅不能にするが他の点では影響を与えない当業者に公知の方法を使用して(即ち、DNA損傷を作製することによって)処理され得る。例えば、pUC 19ベクターDNAが、短波長紫外線を使用して約45分間(即ち、典型的に30〜60分間)照射され得、これは、DNA構造中に「ピリミジンダイマー」と呼ばれるものを作製する。増幅プロセスについて典型的に使用されるポリメラーゼ酵素は、鋳型DNA上のダイマーを「読み通す」ことができず、従って、照射されたpUC DNAは増幅不能である。当業者は、DNAに損傷を与えそれを増幅不能にする任意の他の方法が使用され得ることをさらに認識する。例えば、損傷は、内因性または外因性のプロセスによって発生させられ得る。DNA損傷を生じさせるいくつかの手段としては、UV損傷(UV-B、UV-A)、アルキル化/メチル化、X線損傷、加水分解(即ち、脱プリン化を引き起こす熱的崩壊)、ならびに酸化的損傷が挙げられるが、これらに限定されない。]
[0174] 上述したように、ある態様において、処理された環状キャリアDNAは、環化された標的DNAサンプルへ添加され、直鎖状化工程、特に、噴霧化の使用などの機械的な断片化を使用する直鎖状化の有効性のキャラクタライゼーションを改善する。例えば、1〜4ugの処理されたキャリアpUC DNAが、環化された標的DNAサンプルへ添加され、30psiで2分間噴霧化され、約20kbのペア距離を含むメンバーを有する直鎖状核酸フラグメントが生成され得る。噴霧化されたサンプル全体が、Agilent Technologies製のLabChip 7500テストチップを使用して試験され、噴霧化が所望の結果を生じさせたかどうかが測定される。]
[0175] (表3)未処理キャリアDNAを使用して得られた結果]
[0176] 表3は、増幅後にサンプル中に存在するキャリアDNAの相対的パーセンテージを示し、これは、増幅前にサンプルへ添加された未処理キャリアDNAの量に比例する。例えば、1ug未処理キャリアDNAの添加は、増幅されたサンプル中の核酸分子の6%でキャリアDNAの出現を生じさせ、同様に、3ugの添加は、20%出現を生じさせる。]
[0177] (表4)処理済みキャリアDNAを使用して得られた結果]
[0178] 表4は、増幅後にサンプル中に存在する処理済みキャリアDNAの相対的パーセンテージを示し、ここで、表3中に示される未処理キャリアDNAからの実質的な減少が存在する。例えば、1ug処理済みキャリアDNAの添加は、増幅されたサンプル中の核酸分子の0.02%でキャリアDNAの出現を生じさせ、同様に、3ugの添加は、0.06%出現を生じさせる。]
[0179] 油中水型エマルジョン中におけるライゲーション
本発明のいくつかの態様は、ライゲーションによる核酸分子の環化のための方法も包含する。一般的に、核酸分子の環化は、低い核酸濃度でのライゲーションによって達成される。低濃度は、二次(またはより高次)反応速度論に従う分子間事象よりも、一次反応速度論に従う所望の分子内ライゲーション反応(即ち環化)に有利である(F. M. Ausubel, et al., (eds), 2001, Current Protocols in Molecular Biology, John Wiley & Sons Inc.)。しかし、高希釈度であっても、分子間事象は防止され得ず、核酸の極度の希釈は、実用的ではない。分子間ライゲーション(コンカテマー、二重の環など)の発生は、所望の分子内環化事象の収率を減少させる。いくつかのシナリオにおいて、分子間ライゲーション産物は、下流での適用に不利であり得る。要約すると、従来のアプローチは、少なくとも2つの主要な欠点を有する。第1に、出発核酸を希釈する必要性は、反応体積および関連する試薬のコストを増大させる。高い希釈度はまた、反応産物の効率的な回収を困難にする。第2に、多数の分子間ライゲーション事象が生じ、所望の分子内ライゲーション産物の収率が減少する。]
[0180] 本発明は、上述の従来の環化アプローチに関連する問題を大幅に排除する方法を包含する。例えば、本発明によれば、高い希釈度で、即ち、低い核酸濃度でライゲーション反応を行う必要性は、存在しない。一態様において、適合性のライゲーション可能な末端、例えば、平滑末端またはねじれ型(「粘着」)末端を有する個々の直鎖状の二本鎖DNA分子が、物理的に隔離された反応環境においてライゲーションされる。ライゲーションされるDNAとライゲーション反応に必要な全ての試薬(例えば、DNAリガーゼ、リガーゼ緩衝液、ATPなど)とを含有する水溶液は、好ましくは、エマルジョンを安定化するように機能する界面活性剤の存在下で、油中に乳化される。エマルジョンを作製するための好適な組成物および方法は、下記においてより詳細に考察される。得られた油中水型エマルジョンは、各々が0個、1個、またはそれ以上のDNA分子を含有する、微小滴(マイクロリアクター)を含有する。マイクロリアクター1個当たりのDNA分子の数は、DNA濃度および微小滴のサイズを変えることによって調節され得る。当業者に対して、核酸濃度、ポリヌクレオチドのサイズ(塩基の数として測定される長さ)、および微小滴の平均体積に基づいて好適な条件を算出することは、慣用的な最適化の問題である。理想的な微小滴は、単一のライゲーション可能なDNA分子を含む。しかし、マイクロリアクターの集団において、マイクロリアクター1個当たりのDNA分子の数は、マイクロリアクターのサイズ可変性およびDNA分子のランダムな分布に一部分依存して変化することが、理解される。従って、いくつかのマイクロリアクターは、DNA分子を含有しない場合があり、いくつかは、1個のDNA分子を含有し得、いくつかは、2個またはそれ以上のDNA分子を含有し得る。当業者は、収率およびコスト(試薬の使用)は、マイクロリアクター1個当たりのDNA分子の平均数を変えることによって、必要に応じて釣り合わせることができることを、認識する。]
[0181] 好ましくは、ライゲーション混合物は、それがアセンブリされている間、および乳化工程が完了するまで、低温で(例えば、0〜4℃で)保たれる。これは、ライゲーション反応が、所望のエマルジョン環境が形成される前に進行するのを防ぎ、従って、望ましくない分子間結合の形成を防止する。続いて、乳化されたライゲーション反応物は、ライゲーション反応が許容される温度にてインキュベートされる。インキュベーション時間は、数分間〜1時間、〜数時間、〜一晩、または〜24時間または1日より長い範囲であり得る。このインキュベーションの後、しかしエマルジョンの破壊の前、間、および後に、ライゲーション反応は、合わせたライゲーション反応物中の望ましくない分子間ライゲーションを防止するために停止され得る。ライゲーション反応は、約0〜4℃まで温度を下げること(水氷)、リガーゼの熱不活性化、EDTAの添加、リガーゼインヒビターの添加など、またはこのような方法の任意の組み合わせによって、停止され得る。]
[0182] 当業者は、上述の本発明の方法を、一本鎖もしくは二本鎖RNA、または一本鎖もしくは二本鎖DNAの環化に容易に適用する。例えば、直鎖状一本鎖ポリヌクレオチド分子の末端は、方法1の工程1Kにおいて記載されるように、前記直鎖状一本鎖ポリヌクレオチド分子の各末端に相補的な部分を有するキャッピングオリゴヌクレオチド(架橋オリゴヌクレオチドとも呼ばれる)へアニーリングさせることによって直接並置され得る(図1Lおよび図11を参照のこと)。]
[0183] 乳化されたライゲーション反応は、次いで、好適な温度にてインキュベートされ得る。例えば、T4DNAリガーゼによる「粘着末端」ライゲーションについて、好適なインキュベーション温度は16℃であり、しかし広範な温度が許容される。DNAおよび他の分子のライゲーションについての条件は、当技術分野において広く公知である。エマルジョンにおいて環化反応を行う1つの利点は、延長された反応時間が手順の成功に対して中立であるかまたは有益でさえあることである。例えば、マイクロリアクター1個当たりDNA分子を1個のみ有する理想的なシナリオにおいて、インキュベーション時間は、大部分のDNA分子が環化されるまで延長され得る。対照的に、上述の従来の非エマルジョン方法を使用することによって、延長されたインキュベーション時間は、より高い割合の分子間ライゲーション産物をもたらし得る。本発明のエマルジョンベースのライゲーション方法の別の利点は、分子間ライゲーションの発生を増大させることなく比較的長い時間にわたって反応を進行させる能力である。このような増大したインキュベーション時間により、分子間ライゲーションが起きる危険性の増大を伴わずに、より多い数の環化された産物が可能になる。さらに、前記分子は、濃度依存的様式ではなく物理的手段によって単離されるので、反応体積は、同じ数のライゲーション事象について遥かにより小さいものであり得(即ち、水相中の核酸の核酸濃度は、遥かにより高いものであり得る)、試薬のコストは低下し、サンプルを処理する容易性は増大する。当業者は、所定の微小滴中においてライゲーションが生じるためには、該微小滴が、リガーゼ酵素の少なくとも1個の分子を含む十分な試薬を含有しなければならないことを理解する。]
[0184] エマルジョンの破壊および環化されたDNAの単離
ライゲーションの後、ライゲーション反応は停止され得、エマルジョンは、「破壊される」(当技術分野において「解乳化」とも呼ばれる)。エマルジョンを破壊する多くの方法(例えば、米国特許第5,989,892号およびその中に引用された参考文献を参照のこと)が存在し、当業者は、好適な方法を選択し得る。解乳化に続いて、核酸を単離するための任意の好適な方法によって行われ得る核酸単離工程が行われ得る。一旦核酸が単離されると、ライゲーションされていない物質は、この課題に好適な任意の方法によって除去され得、その方法の1つは、サンプルのエキソヌクレアーゼ消化を行うことである。使用される特定のエキソヌクレアーゼ酵素は、作用される分子の型(一本鎖または二本鎖の、DNAまたはRNA)、および他の考慮すべき事項、例えば、プロセスに都合よく組み入れられる反応温度に、一部分、依存する。環化された物質は、エキソヌクレアーゼ処理の後に、当技術分野において公知である多くの手順のうちの1つ、例えば、フェノール/クロロホルム抽出またはこの目的に好適な任意の市販の精製キットによって、精製する必要がある。]
[0185] 上述の従来の希釈ベースの環化プロトコルを使用すると、所望の環状産物の回収は、直鎖状の投入したDNA分子の長さの増大に伴って減少することが、観察された。本発明のエマルジョンライゲーション方法は、長いポリヌクレオチド分子、例えば、約500塩基より長いか、約1000塩基より長いか、約2000塩基より長いか、約5000塩基より長いか、約10000塩基より長いか、約20,000塩基より長いか、約50,000塩基より長いか、約100,000塩基より長いか、約250,000塩基より長いか、約100万塩基より長いか、もしくは約500万塩基より長いか、または関心対象の実験プロトコルにおいて望ましいと考えられる事実上任意のサイズの分子の環化において特に有用である。]
[0186] 本明細書中に記載されるエマルジョンライゲーション方法は、それらが環化をもたらすか否かにかかわらず、広範な種々のライゲーション反応において有用である。従って、上述のエマルジョンライゲーション法は、本明細書に記載の種々の方法の任意のライゲーション工程、特に、投入した核酸の環化が望まれるライゲーション反応において使用され得る。]
[0187] 乳化
エマルジョンは、2つの非混和性液相の不均一な系であり、相の一方が、他方の相中に顕微鏡サイズまたはコロイドサイズの液滴として分散される。本発明のエマルジョンは、マイクロカプセル(マイクロリアクター)の形成を可能にしなければならない。エマルジョンは、非混和性液体の任意の好適な組み合わせから生成され得る。本発明のエマルジョンは、微細に分かれた液滴の形態で存在する相(分散、内部または不連続相)として親水性の相(生化学的成分を含有)、および、これらの液滴が懸濁されるマトリックス(非分散、連続または外部相)として疎水性の非混和性液体(「油」)を有する。このようなエマルジョンは、「油中水型)」(W/O)と呼ばれる。これは、生化学的成分を含有する水相全体が分離した液滴(内部相)に区画化されているという利点を有する。疎水性の油である外部相は、一般に、生化学的成分を含有せず、従って不活性である。]
[0188] ある態様において、マイクロリアクターは、核酸ライゲーションに必要な試薬を含有する。複数のマイクロリアクターは、それぞれ、ちょうど1個のポリヌクレオチド分子を含有し得る。特定の態様において、例えば、リガーゼの熱不活性化が反応後に行われる場合、またはライゲーションが耐熱性リガーゼ(例えば、TaqDNAリガーゼ)を使用して高温で行われる場合、耐熱性の油中水型エマルジョンが望ましい。エマルジョンは、当技術分野において公知の任意の好適な方法によって形成され得る。エマルジョンを作製する1つの方法を下記に記載するが、エマルジョンを作製するための任意の方法が使用され得る。これらの方法は、当技術分野において公知であり、これらとしては、アジュバント法、向流法、逆流法、振盪、回転ドラム法、およびメンブレン法が挙げられる。さらに、マイクロカプセルのサイズは、成分の流量および速度を変えることによって調節され得る。例えば、滴下において、液滴のサイズおよび送達の合計時間は、変えられ得る。ある態様において、微小滴は、例えば、参照により全体として本明細書に組み入れられるLinkら(Angew. Chem. Int. Ed., 2006, 45, 2556-2560)によって記載されるようなマイクロ流体デバイス内で作製され得る。]
[0189] マイクロリアクターの少なくともいくつかは、十分な核酸および他のライゲーション試薬を含むのに十分に大きくあるべきである。しかし、マイクロリアクターの少なくともいくつかは、そのマイクロリアクター集団の一部が単一の自己ライゲーション可能なポリヌクレオチド分子を含有するように十分に小さくあるべきである。ある態様において、エマルジョンは、熱安定性である。好ましくは、形成される液滴は、直径が約100ナノメートル〜約500マイクロメートル、より好ましくは、約1マイクロメートル〜約100マイクロメートルのサイズの範囲である。有利には、任意で電場と組み合わせられた、直交流流体混合が、液滴形成の制御および液滴サイズの均一性を可能にする。]
[0190] 生物学的反応に好適である種々のエマルジョンは、参照により各々が完全に本明細書に組み入れられる、Griffiths and Tawfik,EMBO, 22, pp. 24-35 (2003);Ghadessy et al., Proc. Natl. Acad. Sci. USA 98, pp. 4552-4557 (2001);米国特許第6,489,103号およびWO 02/22869において言及されている。好ましい態様において、油はシリコーンオイルである。]
[0191] 界面活性剤
本発明のエマルジョンは、1つまたは複数の表面活性剤(エマルジョン安定化剤;界面活性剤)の添加によって安定化され得る。これらの界面活性剤は、乳化剤とも呼ばれ、水/油界面にて作用し、相の分離を防止する(または少なくとも遅らせる)。多くの油および多くの乳化剤が、油中水型エマルジョンの作製のために使用され得る;最近の編集物は、16,000種を超える界面活性剤を記載し、それらの多くは、乳化剤として使用される(Ash, M. and Ash, I. (1993) Handbook of industrial surfactants. Gower, Aldershot)。本発明の方法において使用されるエマルジョン安定化剤としては、Atlox 4912、ソルビタンモノオレエート(Span80;ICI)、ポリオキシエチレンソルビタンモノオレエート(Tween80;ICI)ならびに他の認識される市販の好適な安定化剤が挙げられる。]
[0192] 種々の態様において、界面活性剤は、0.5〜50%、好ましくは、10〜45%、より好ましくは、30〜40%のエマルジョンの油相中のv/v濃度で提供される。]
[0193] ある態様において、化学的に不活性なシリコーンベースの界面活性剤、例えば、シリコーンコポリマーが、使用される。一態様において、使用されるシリコーンコポリマーは、ポリシロキサン−ポリセチル−ポリエチレングリコールコポリマー(セチルジメチコンコポリオール)、例えば、Abil(登録商標)EM90(Goldschmidt)である。]
[0194] 化学的に不活性なシリコーンベースの界面活性剤は、エマルジョン組成物中における唯一の界面活性剤として提供されてもよく、または数種の界面活性剤の1つとして提供されてもよい。従って、異なる界面活性剤の混合物が、使用され得る。]
[0195] 特定の態様において、使用される1つの界面活性剤は、Dow Corning(登録商標)749 Fluidである(1〜50%、好ましくは、10〜45%、より好ましくは25〜35%w/wで使用される)。他の特定の態様において、使用される1つの界面活性剤は、Dow Corning(登録商標)5225C Formulation Aidである(1〜50%、好ましくは、10〜45%、より好ましくは35〜45%w/wにて使用される)。好ましい態様において、油/界面活性剤混合物は、40%(w/w)Dow Corning(登録商標)5225C Formulation Aid、30%(w/w)Dow Corning(登録商標)749 Fluid、および30%(w/w)シリコーンオイルからなる。]
[0196] 本発明の方法は、現行の方法を上回る複数の利益および利点を提供する。先行技術を上回る本方法の1つの利点は、真核生物または原核生物宿主中における作製されたフラグメントのクローニングおよび増殖が必要とされないことである。これは、標的配列が宿主細胞中におけるエピソームとしての増殖の間に再配列され得る複数の反復を含む場合、特に有用である。]
[0197] 本開示の方法の別の利点は、それが、コンティグ配列だけでなく、100bpを超えるか、300bpを超えるか、500bpを超えるか、1kbを超えるか、5kbを超えるか、10kbを超えるか、100kbを超えるか、1Mbを超えるか、10Mbを超えるか、またはより長い長さを有し得る長いコンティグの末端配列および末端配列の方向も提供することによってゲノムアセンブリを容易にし得ることである。この配列情報および方向情報は、ゲノムアセンブリを容易にし、ギャップ閉鎖を提供するために、使用され得る。]
权利要求:

請求項1
−核酸分子を断片化し、標的核酸分子を生成する工程;−組換えアダプターエレメントを標的核酸分子の各末端へライゲーションし、アダプター付加(adapted)標的核酸分子を生成する工程;−アダプター付加標的核酸を部位特異的リコンビナーゼへ曝露し、アダプター付加標的核酸から環状核酸産物および直鎖状核酸産物を生成する工程であって、環状核酸産物が標的核酸分子を含む、工程;ならびに−環状核酸産物を断片化し、標的核酸分子の各末端由来の配列領域を含む鋳型核酸分子を生成する工程を含む、インビトロの反応において標的核酸の2つの末端領域を含むDNA構築物を得るための方法。
請求項2
アダプター付加標的核酸を部位特異的リコンビナーゼへ曝露する工程の後に、非環状分子を除去する工程をさらに含む、請求項1記載の方法。
請求項3
−鋳型核酸を増幅し、複数の実質的に同一のコピーを含む集団を生成する工程;および−前記集団を配列決定し、鋳型核酸の配列組成を含む配列データを作成する工程をさらに含む、請求項1記載の方法。
請求項4
組換えアダプターエレメントが、第1の組換えアダプターエレメントおよび第2の組換えアダプターエレメントを含み、第1および第2の組換えアダプターエレメントが両方とも方向エレメントを含む、請求項1記載の方法。
請求項5
部位特異的リコンビナーゼが、Creリコンビナーゼを含む、請求項1記載の方法。
請求項6
標的核酸分子が、少なくとも3Kb、少なくとも8Kb、少なくとも10Kb、少なくとも20Kb、少なくとも50Kb、および少なくとも100Kbからなる群より選択される長さを含む、請求項1記載の方法。
請求項7
大きな核酸分子がゲノムDNAを含む、請求項1記載の方法。
請求項8
環状核酸産物が第1のハイブリッド組換えアダプターを含み、かつ直鎖状核酸産物が第2のハイブリッド組換えアダプターを含み、第1および第2のハイブリッド組換えアダプターが、ライゲーションされた組換えアダプター由来のエレメントを含む、請求項1記載の方法。
請求項9
環状核酸産物を断片化する工程が噴霧化を含む、請求項1記載の方法。
請求項10
−大きな核酸分子を断片化し、複数の標的核酸分子を生成する工程;−組換えアダプターエレメントを標的核酸分子の各末端へライゲーションし、複数のアダプター付加標的核酸分子を生成する工程;−アダプター付加標的核酸分子を部位特異的リコンビナーゼへ曝露し、アダプター付加標的核酸分子から複数の環状核酸産物および複数の直鎖状核酸産物を生成する工程であって、環状核酸産物が標的核酸分子を含む、工程;ならびに−環状核酸産物を断片化し、標的核酸分子の各末端由来の配列領域を含む複数の鋳型核酸分子を生成する工程を含む、インビトロの反応において標的核酸の2つの末端領域を含む複数のDNA構築物を得るための方法。
請求項11
−複数の組換えアダプターエレメント;および−好ましくはCreリコンビナーゼである、部位特異的リコンビナーゼを含む、請求項1記載の方法を行うためのキット。
請求項12
−複数の組換えアダプターエレメント;−好ましくはCreリコンビナーゼである、部位特異的リコンビナーゼ;−エキソヌクレアーゼ;および−好ましくはpUC19である、環状キャリアDNAを含む、請求項1記載の方法を行うためのキット。
类似技术:
公开号 | 公开日 | 专利标题
EP3377625B1|2020-07-08|Method for controlled dna fragmentation
US20190324042A1|2019-10-24|Methods of Nucleic Acid Sequencing
US9822395B2|2017-11-21|Methods for producing a paired tag from a nucleic acid sequence and methods of use thereof
US20190264272A1|2019-08-29|Methods, compositions, systems, apparatuses and kits for nucleic acid amplification
US20200087652A1|2020-03-19|Capture of nucleic acids using a nucleic acid-guided nuclease-based system
US10457969B2|2019-10-29|Polynucleotide enrichment using CRISPR-Cas systems
US20200277596A1|2020-09-03|Compositions and methods for labeling of agents
US20180201976A1|2018-07-19|Methods and transposon nucleic acids for generating a dna library
US10190164B2|2019-01-29|Method of making a paired tag library for nucleic acid sequencing
JP6366719B2|2018-08-01|断片化したゲノムdna試料におけるゲノム連結性情報の保存
JP6563912B2|2019-08-21|Compositions and methods for sample processing
US9243242B2|2016-01-26|Methods of making di-tagged DNA libraries from DNA or RNA using double-tagged oligonucleotides
US20190078082A1|2019-03-14|Compositions and methods for targeted nucleic acid sequence enrichment and high efficiency library generation
EP2970951B1|2019-02-20|Methods for nucleic acid sequencing
US10669571B2|2020-06-02|Compositions and methods for targeted depletion, enrichment, and partitioning of nucleic acids using CRISPR/Cas system proteins
US10246705B2|2019-04-02|Linking sequence reads using paired code tags
US10793904B2|2020-10-06|Methods for sequencing a polynucleotide template
US10570448B2|2020-02-25|Compositions and methods for identification of a duplicate sequencing read
KR20170073667A|2017-06-28|표적화 핵산 서열 분석을 위한 방법 및 조성물
US20190203204A1|2019-07-04|Methods of De Novo Assembly of Barcoded Genomic DNA Fragments
EP2861787B1|2017-09-20|Compositions and methods for negative selection of non-desired nucleic acid sequences
JP6453232B2|2019-01-16|固形支持体でのサンプル調製
JP6014249B2|2016-10-25|Kinetic exclusion amplification of nucleic acid libraries
ES2762866T3|2020-05-26|Reemplazo de nucleótidos por bibliotecas doblemente etiquetadas y direccionales
EP2635679B1|2017-04-19|Linking sequence reads using paired code tags
同族专利:
公开号 | 公开日
CN102027130A|2011-04-20|
EP2242855A1|2010-10-27|
WO2009098037A1|2009-08-13|
CA2712426A1|2009-08-13|
引用文献:
公开号 | 申请日 | 公开日 | 申请人 | 专利标题
法律状态:
2011-09-01| A761| Written withdrawal of application|Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20110831 |
优先权:
申请号 | 申请日 | 专利标题
[返回顶部]